Москва, Варшавское шоссе, 9
Метро: Верхние КотлыИщем нового члена команды Data Engineer в направление рекомендаций, который будет совместно с нами строить пайплайны и развивать платформу данных. В нашей команде коллеги быстро растут и получают опыт в разных задачах — от классического ETL для аналитических витрин до потоковой обработки в реальном времени для ML.
В Okko хорошо развиты data-driven процессы: большое количество A/B экспериментов, источников и витрин делает работу Data Engineer особенно важной. Здесь ваш вклад реально виден: коллеги ценят результаты вашей работы, а ваши решения напрямую влияют на качество аналитики и эффективность ML-моделей.
Работа организована по Scrum с двухнедельными спринтами, а перфоманс-ревью проводится каждые полгода.
В команде рекомендаций сейчас два Data Engineer, и мы ищем коллег, чтобы поддерживать текущий ритм разработки, а также развивать потоковую обработку данных и функциональность feature store.
Что предстоит делать:
поддержка и разработка batch ETL-пайплайнов на Airflow для аналитических витрин и ML;
потоковая обработка данных с использованием Spark Streaming, Kafka, MongoDB;
развитие feature store как инструмента, наполнение его фичами и интеграция данных для ML-моделей;
документирование, оптимизация и мониторинг пайплайнов и потоков данных.
Наш стек:
Требования:
уверенное знание Python и SQL;
опыт построения ETL-процессов с использованием перечисленного стека;
будет плюсом: опыт работы с CI/CD, Docker, Grafana.
Условия:
Москва
до 290000 RUR