Привет! Это команда MLOps команды "Эффективность Рекомендаций".
Мы отвечаем за pipeline сбора данных, обучение, валидацию и мониторинг моделей ранжирования для рекомендательных сервисов. Наша задача сделать этот процесс максимально эффективным, предсказуемым и стабильным.
Сейчас мы ищем уверенного инженера данных к нам в команду.
Наш стек:
- Python, PySpark, Airflow, Grafana, Clickhouse.
Вы будете:
- Создавать стабильные отказоустойчивые и масштабируемые системы обработки данных.
- Писать регрессионные тесты (в разработке используем TDD).
- Создавать инструменты мониторинга.
- Настраивать процессы CI/CD.
- Проектировать архитектуру систем обработки данных.
- Создавать и валидировать прототипы решений.
- Работать над продуктизацией моделей catboost и нейросетевых моделей.
Нам важно:
- Продвинутое владение Python и понимание основ ООП.
- Хорошее знание PySpark (как Dataframe API так и Spark SQL API).
- Хорошее знание основ ML, ML-процессов и основных метрик качества ML-моделей.
- Опыт в оптимизации производительности запросов и ETL процессов.
- Уверенный технический бэкграунд (вы представляете себе, что такое контейнеры, k8s, kafka и т. д).
Будет плюсом:
- Опыт разработки/продуктизации нейросетевых моделей.
- Опыт работы с Airflow.
- Опыт написания микросервисов на языке Golang.
Работа в Ozon Tech — это:
- Люди, которым не всё равно — ценим инициативу и самостоятельность, доверяем друг другу и даём свободу в принятии решений;
- Открытая культура — мы учимся на ошибках и фокусируемся на решении проблем, а не на поиске виноватых;
- Сильная команда, которой мы гордимся — обсуждаем идеи, обмениваемся экспертизой, просим совета и поддерживаем друг друга;
- Современный стэк и развитая инженерная культура — реализуем амбициозные проекты и создаём решения, которых ещё нет на рынке.