Data–инженер в Сбербанке

Хотите стать data–инженером в Сбербанке? Тогда эта вакансия для Вас, а мы обеспечим Вас интересными задачами!

Департамент информационных технологий блоков «Риски» и работы с ПА находится в поисках кандидатов на вакансии data-инженеров. Совместно со специалистами блока Риски, которые разрабатывают инновационные модели для бизнес-процессов банка в роли data–инженера Вы будете:

• разрабатывать витрины данных для задач моделирования, создавать выборки для обучения и тестирования моделей

• разрабатывать алгоритмы трансформации и очистки данных

• организовывать процессы сбора данных из систем-источников (анализ атрибутного состава, качества данных, выбор систем-источников, выбор методов загрузки, реализация механизмов загрузки)

Мы заинтересованы в привлечении как опытных, так и начинающих специалистов!

Мы используем:

• СУБД: Oracle, Teradata, Hadoop

• Языки: Python, Scala, R

• Управление требованиями: Jira, Confluenсe

• DevOps: Jenkins, Nexus

Ключевые требования, которым вам необходимо соответствовать:

• Высшее техническое или физико-математическое образование

• Знание алгоритмов и структур данных*

• Знание SQL, Python

• Опыт работы с Hadoop + Spark

• Навыки работы с Bash, Git

• Управление требованиями: Jira, Confluenсe, DevOps: Jenkins, Nexus

• Владение навыками коммуникации

• Готовность работать в команде на общий результат, адекватные коммуникационные навыки

• Опыт работы с Hadoop, навыки применения Spark, Impala

• Базовое понимание кредитного процесса в банке

• Базовое понимание жизненного цикла разработки моделей

• Базовые знания математической статистики, теории вероятностей

В зависимости от позиции, на которую Вы претендуете, Вам потребуется:

• Опыт работы от 2х лет

• Опыт работы с СУБД Oracle|Teradata|Hadoop

• Умение подготовить требования на основе постановки бизнес-задачи

Перечень решаемых задач может варьироваться в зависимости от специализации:

Data-инженер по разработке моделей

Работа в тесной связке с Data-scientists – разработчиками статистических моделей для автоматизации и повышения эффективности процессов принятия решений в Банке, а также с бизнес-заказчиками моделей

Ожидаемые задачи:

1. Подготовка данных для разработки конкретных моделей – анализ данных в системах Банка и/или внешних источниках (технический и смысловой), склейка данных из разных источников, очистка данных, выделение выборок, создание витрин данных для разработки

2. Разработка и поддержка промышленных витрин для разработки моделей – для постоянно используемых в моделях источников данных

3. Поддержка Data-инженеров по внедрению разработанных моделей с точки зрения используемых данных (модель должна работать на тех же данных, на каких она разрабатывалась)

Data-инженер по работе с моделями графовой аналитики.

Для работы по этому направлению Вам дополнительно потребуется:

• Опыт разработки на Java/Scala/C++

• Опыт подготовки данных для DL моделей (Python, Numpy, Numba, Pyarrow) и понимание их дальнейшего пути (Dataset/Dataloader)

• Навыки работы с Docker, Kubernetes

Data-инженер по разработке моделей для автоматического сканирования новостного потока с помощью инструментов семантического анализа.

Основная задача – отслеживание негативных тенденций в финансовом состоянии контрагентов в режиме реального времени. Каждый день только в Рунете появляется 35 000 новостей, среди которых есть как реальные сигналы, так и откровенный мусор. Из них релевантными окажутся 10, но каждая из них может предотвратить потери банка.

Дополнительным плюсом будет:

• Опыт работы (от 1 года) разработчиком на любом языке

• Опыт работы (от 1 года) бизнес-аналитиком с функцией выборки и подготовки данных

• Опыт построения витрин БД (Oracle, Teradata, Hadoop)

Почта для резюме: Eliseev.E.A@sberbank.ru

28 апреля 2021