Чем предстоит заниматься:
- Сбор данных, выбор модели, тестирование, внедрение;
- Исследование данных (ad-hoc аналитика, сегментация/кластеризация);
- Разработка и тестирование новых признаков, интерпретируемых и не интерпретируемых (эмбеддингов);
- Создание метрик оценки качества data-продуктов;
- Построение пред-продакшен пайплайнов ML-моделей, ведение с АБ-тестирования.
Наши ожидания: - Уверенное владение Python и SQL;
- Знание ML (алгоритмы, метрики) и опыт работы с ML-библиотеками;
- Знание классических алгоритмов и структур данных;
- Хорошая математическая подготовка;
Знание границ применимости алгоритмов и метрик, умение выбрать подходящие под задачу; - Опыт работы с Keras/TensorFlow/ PyTorch;
- Будет плюсом:
- знание PySpark;
- опыт разработки рекомендательных систем;
- опыт разработки антифрод-моделей;
- опыт в промпт-инжиниринге.