Аналитик по обработке данных, Райффайзенбанк
В команду валидации внутренних моделей требуется аналитик по обработке данных для проведения валидации, а также проверки качества данных, используемых в рамках разработки и применения моделей.
Мы готовы рассмотреть специалистов разного уровня — у нас есть задачи и перспективы для специалистов уровней Junior и Middle. Наш идеальный кандидат имеет опыт программирования на Python, SAS и применения SQL, использования Hadoop, HDFS, а также обладает теоретическими знаниями в области разработки статистических моделей.
Чем тебе предстоит заниматься:
- собирать и подготавливать данные для валидации и мониторинга моделей (работа с хранилищами SAS, Oracle, Hadoop);
- проверять данные, используемые для разработки моделей и скрипты по их сбору;
- применять техники потоковой обработки данных для решения real time задач;
- строить витрины данных, выбирая оптимальный формат и структуру хранения данных;
- придумывать индикаторы качества данных;
- использовать SQL, Python, SAS, Hadoop, Spark, Hive.
Требования
- На позиции младшего аналитика по обработке данных:
- умение работать с SQL (join’ы, подзапросы, агрегатные функции, DDl, DML, DCL, CTE, транзакции);
- способность объяснить, что такое ООП;
- умение писать код на Python, SAS (или R);
- знания теории: теория вероятностей, математическая статистика, эконометрика, понимание алгоритмов моделирования (в том числе ML);
- желание учиться новому (особенно в банковской сфере) и активно развивать технические навыки.
- На позиции аналитика по обработке данных:
- соответствие требованиям к младшему аналитику;
- знание специфики банковской предметной области;
- опыт работы с SQL и написания сложных запросов;
- опыт использования Hadoop;
- практический опыт разработки моделей (в том числе ML);
- умение тестировать гипотезы, визуализировать результаты анализа данных;
- умение писать читабельный код, разделять его на классы, применять паттерны;
- обязательный и частый коммитмент сделанных изменений в коде;
- умение работать самостоятельно.
Дополнительными преимуществами станут:
- опыт работы с любой из «классических» РСУБД (Oracle, MS-SQL PostgreSQL);
- опыт написания кода на Spark и способность считать данные сервиса, используя его Rest API, отсортировать, отфильтровать их и сохранить результат на HDFS;
- возможность продемонстрировать один из своих проектов на GitHub.
Мы предлагаем:
- свободу в выборе инструментов для решения задач;
- регулярное посещение тренингов, митапов и конференций (в том числе в роли спикера);
- командную работу и поддержку;
- гибкое время начала рабочего дня;
- отличный социальный пакет (ДМС, скидки на корпоративные продукты, спортзал в здании офиса);
- уютное кафе в здании, где можно пообедать и в любое время выпить свежесваренный кофе;
- комфортный офис в одной минуте от станции метро «Технопарк»;
- позитивный настрой и отсутствие бюрократии.
Контактное лицо: Пугачёва Дарья Darya.PUGACHEVA@raiffeisen.ru
Служба содействия трудоустройству
14 августа 2020