Команда занимается развитием автоматического матчинга (поиска одинаковых товаров) как внутри Ozon, так и между Ozon и другими маркетплейсами. Среди текущих целей команды есть такие, как повышение полноты матчинга за счёт обучения новых текстовых и мультимодальных моделей.
Вам предстоит:
- Полный цикл — от аналитики и сбора датасета до обучения и выкатки в прод новых моделей.
- Разработка для расширения функционала пайплайна.
- Построение инструментов для валидации результатов.
- Добавление новых факторов в ML модели.
- Исследование новых подходов для решения задачи.
- Написание и оптимизация алгоритмов обработки данных на PySpark.
Наш стэк: Python, Pyspark, Hive, Pytorch, Catboost, Kafka, Airflow, Gitlab, Mlflow, Clickhouse, Vertica
Что мы ожидаем:
- Коммерческий опыт в DS от 5 лет.
- Опыт в ценообразовании или прогнозе спроса.
- Опыт в классическом MLE (полный цикл: аналитика, сбор датасета, обучение, выкатка, поддержка).
- Знание Python и PySpark (у нас пайплайны на них).
- Проактивность, большое желание развиваться и развивать людей вокруг.
Будет плюсом:
- Успешное участие в соревнованиях по ML.
С нами классно работать:
- Масштабные и значимые задачи — мы строим один из крупнейших e-commerce в стране.
- Нам не всё равно — ценим инициативу и самостоятельность, доверяем команде и даём свободу в принятии решений.
- Открытая культура — мы учимся на ошибках и фокусируемся на решении проблем, а не на поиске виноватых.
- Сильная команда, которой мы гордимся — обсуждаем идеи, обмениваемся экспертизой, просим совета и поддерживаем друг друга.
- Современный стэк и развитая инженерная культура — реализуем амбициозные проекты и создаём решения, которых ещё нет на рынке.