Москва, проспект Лихачёва, 15
Метро: АвтозаводскаяМы ищем data engineer’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас хорошая математическая подготовка, вы любите анализировать большие объемы данных и хотите получить опыт участия в полном цикле разработки ML-решений, а также готовы внедрять эти решения и влиять на бизнес, то мы будем рады видеть вас в нашей команде.
Наши модели работают в online-режиме 24/7, решая задачи оценки риска, выявления фрода, ценообразования и формирования индивидуальных предложений. Мы оцениваем влияние нашей работы на бизнес-метрики с помощью A/B-тестов. Используем в работе open-source решения: Spark, MLFlow, DVC, Feast, CatBoost, Docker, данные готовим на Hadoop-кластере.
Обязанности:
Уверенный Python и Отличные знания SQL (JOIN, подзапросы, оконные функции);
Уверенные знания стека Hadoop (HDFS, YARN, Hive) и Pyspark;
Понимание принципов построения data-пайплайнов (kappa И lambda - архитектуры);
Знакомство с Kafka и Airflow, понимание их роли в data-пайплайне;
Знание базовых команд Linux-консоли, git;
Интерес к технологиям больших данных и большое желание учиться.
Будет плюсом:
Москва
до 300000 RUR
NM TEAM SOCIAL MEDIA APPLICATIONS DEVELOPMENT & MANAGEMENT CO. L.L.C
Москва
от 350000 RUR