Eng

Data–инженер в Сбербанке

Data–инженер в Сбербанке

Хотите стать data–инженером в Сбербанке?  Тогда эта вакансия для Вас, а мы обеспечим Вас интересными задачами!

Департамент информационных технологий блоков «Риски» и работы с ПА находится в поисках кандидатов на вакансии data-инженеров. Совместно со специалистами блока Риски, которые разрабатывают инновационные модели для бизнес-процессов банка в роли data–инженера Вы будете:

разрабатывать витрины данных для задач моделирования, создавать выборки для обучения и тестирования моделей
разрабатывать алгоритмы трансформации и очистки данных
организовывать процессы сбора данных из систем-источников (анализ атрибутного состава, качества данных, выбор систем-источников, выбор методов загрузки, реализация механизмов загрузки)

Мы заинтересованы в привлечении как опытных, так и начинающих специалистов!

 

Мы используем:

СУБД: Oracle, Teradata, Hadoop
Языки: Python, Scala, R 
Управление требованиями: Jira, Confluenсe
DevOps: Jenkins, Nexus 

 

Ключевые требования, которым вам необходимо соответствовать:

Высшее техническое или физико-математическое образование
Знание алгоритмов и структур данных*
Знание SQL, Python
Опыт работы с Hadoop + Spark
Навыки работы с Bash, Git
Управление требованиями: Jira, Confluenсe, DevOps: Jenkins, Nexus
Владение навыками коммуникации
Готовность работать в команде на общий результат, адекватные коммуникационные навыки
Опыт работы с Hadoop, навыки применения Spark, Impala
Базовое понимание кредитного процесса в банке
Базовое понимание жизненного цикла разработки моделей
Базовые знания математической статистики, теории вероятностей

 

В зависимости от позиции, на которую Вы претендуете, Вам потребуется:

Опыт работы от 2х лет
Опыт работы с СУБД Oracle|Teradata|Hadoop
Умение подготовить требования на основе постановки бизнес-задачи

 

Перечень решаемых задач может варьироваться в зависимости от специализации:

Data-инженер по разработке моделей

Работа в тесной связке с Data-scientists – разработчиками статистических моделей для автоматизации и повышения эффективности процессов принятия решений в Банке, а также с бизнес-заказчиками моделей

 

Ожидаемые задачи:

1. Подготовка данных для разработки конкретных моделей – анализ данных в системах Банка и/или внешних источниках (технический и смысловой), склейка данных из разных источников, очистка данных, выделение выборок, создание витрин данных для разработки
2. Разработка и поддержка промышленных витрин для разработки моделей – для постоянно используемых в моделях источников данных
3. Поддержка Data-инженеров по внедрению разработанных моделей с точки зрения используемых данных (модель должна работать на тех же данных, на каких она разрабатывалась)

 

Data-инженер по работе с моделями графовой аналитики. 

Для работы по этому направлению Вам дополнительно потребуется:

Опыт разработки на Java/Scala/C++
Опыт подготовки данных для DL моделей (Python, Numpy, Numba, Pyarrow) и понимание их дальнейшего пути (Dataset/Dataloader)
Навыки работы с Docker, Kubernetes

 

Data-инженер по разработке моделей для автоматического сканирования новостного потока с помощью инструментов семантического анализа

Основная задача – отслеживание негативных тенденций в финансовом состоянии контрагентов в режиме реального времени. Каждый день только в Рунете появляется 35 000 новостей, среди которых есть как реальные сигналы, так и откровенный мусор. Из них релевантными окажутся 10, но каждая из них может предотвратить потери банка.

 

Дополнительным плюсом будет:

Опыт работы (от 1 года) разработчиком на любом языке
Опыт работы (от 1 года) бизнес-аналитиком с  функцией выборки и подготовки данных
Опыт построения витрин БД (Oracle, Teradata, Hadoop)

 Почта для резюме: Eliseev.E.A@sberbank.ru


28 апреля 2021