Привет! Это команда Эффективность рекомендаций
В команду рекомендаций Ozon мы ищем разработчика в группу MLOps.
Мы разрабатываем компонентные решения для поддержки работы исследователей и аналитиков.
Автоматизируем ETL-процессы, обучение ML-моделей. Наша задача сделать эти процессы максимально эффективным,
предсказуемым и стабильными.
Основной стек: Python, PySpark, Airflow, Grafana, Clickhouse
Вы будете:
- Создавать стабильные отказоустойчивые и масштабируемые системы обработки данных;
- Писать регрессионные тесты (в разработке используем TDD);
- Проектировать архитектуру систем обработки данных;
- Создавать и валидировать прототипы решений;
- Работать над продуктизацией моделей;
- Создавать инструменты мониторинга;
- Проводить Code Review;
- Настраивать процессы CI/CD
Нам важно:
- Продвинутое владение Python и понимание основ ООП;
- Хорошее знание PySpark (как Dataframe API так и Spark SQL API);
- Опыт в оптимизации производительности запросов и ETL процессов;
- Уверенный технический бэкграунд (вы представляете себе, что такое контейнеры, k8s, kafka и т. д)
Будет плюсом:
- Опыт работы с Airflow;
- Знание основ ML, ML-процессов и основных метрик качества ML-моделей