Data Scientist

Описание вакансии

Обязанности

• Погружение: разобраться в бизнес контексте, данных и инфраструктуре.

• Анализ текущего решения: изучить существующее решение и найти его слабое место — как в самом подходе, так и в таргете, признаках при наличии.

• R&D: Опробовать разные ML подходы: классификация, кластеризация, uplift и ранжирующие модели, нейросети (можно часть из них). Сравнить имеющееся решение и опробованные

• Валидация: проверить качество offline метриками (AUC/PR, NDCG для ранжирования, uplift метрики и др.), убедиться, что есть статистически значимый прирост в точности

• Итог: написать статью/отчёт со сравнением методов. Если получится — запускаем лучшее решение в прод в параллель с имеющимся и проводим ABC тест.

Требования

• Стек: Уверенный Python, продвинутый SQL. Базовое понимание PySpark — плюс.

• Классический ML: Хорошие знания алгоритмов. Бустинги, деревья, логистическая и линейная регрессия, кластеризация, uplift и ранжирующие модели (плюс), работа с дисбалансом, калибровка.

• Deep Learning / RecSys / NLP - плюс: Базовые представления о нейронных сетях (MLP, embeddings), рекомендательных системах и NLP задачах.

• Математика и аналитика: Теория вероятностей, доверительные интервалы, статистические тесты, бутстрэп.

• Soft skills: Чёткая коммуникация и самостоятельность в отладке кода.

Условия

• Сильное DS community, большое разнообразие рабочих и внерабочих активностей;

• Конкурентную заработную плату, соцпакет;

• Условия для роста и развития (в т.ч. конференции, тренинги, внутренние программы развития).

• Дружный коллектив единомышленников (все специалисты, занимающиеся машинным обучением объединены одним департаментом для максимально плотного и продуктивного обмена знаниями).

• Передовой стек технологий, высокопроизводительное оборудование.

• Возможность решать разнообразные прикладные задачи с выводом в промышленную эксплуатацию, возможность существенно влиять на результат (в т.ч. в бизнес-смысле) и способы его достижения (вплоть до внесения изменений в архитектуру).

• Квартальный бонус по результатам работы;

• ДМС, страхование жизни;

• Корпоративное обучение;

Навыки
  • Python
  • SQL
  • Hadoop
  • PySpark
  • Apache Spark
  • Spark
Посмотреть контакты работодателя

Похожие вакансии

YADRO
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Hi, Rockits!
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Домклик

Data Scientist NLP

Домклик

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Федеральная сеть книжных магазинов Читай-город

Data Engineer (Дата инженер)

Федеральная сеть книжных магазинов Читай-город

Удаленная работа
  • Москва

  • Не указана

Мокка
Удаленная работа
  • Москва

  • Не указана

Диплей

Data Engineer [Middle]

Диплей

Удаленная работа
  • Москва

  • Не указана

Медиапоинт
Удаленная работа
  • Москва

  • Не указана

Qugo
Удаленная работа
  • Москва

  • Не указана

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • Не указана

Ок Софт

Antifraud data analyst

Ок Софт

Удаленная работа
  • Москва

  • Не указана

Туту
Удаленная работа
  • Москва

  • Не указана

Sape
Удаленная работа
  • Москва

  • Не указана

Лемана ПРО
Удаленная работа
  • Москва

  • Не указана

Удаленная работа
  • Москва

  • от 200000 RUR

Иннова

Data Engineer

Иннова

Удаленная работа
  • Москва

  • от 200000 RUR

АйТиИ Экспо Интернешнл

Data Engineer/Инженер данных

АйТиИ Экспо Интернешнл

Удаленная работа
  • Москва

  • от 200000 RUR

IBS
Удаленная работа
  • Москва

  • от 200000 RUR

билайн
Удаленная работа
  • Москва

  • от 200000 RUR

Газпромбанк
Удаленная работа
  • Москва

  • от 200000 RUR

Газпромбанк
Удаленная работа
  • Москва

  • от 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию