Big Data Engineer

Описание вакансии

Мы в поиске Инженера по работе с большими данными в команду дата-инжиниринга, который будет участвовать в ключевых проектах Lamoda, обеспечивая стабильную и масштабируемую инфраструктуру для обработки и анализа данных.
В рамках этой роли вы будете решать задачи продуктового направления прайсинга, которое:

  • Отвечает за ценообразование: регулярные цены, акции, персональные предложения.
  • Разрабатывает ML-модели и алгоритмы конкурентного матчинга с применением DL, NLP, CV и классических ML-методов.
  • Интегрирует модели с управлением ассортиментом, остатками и контентом.
  • Реализует data-driven проекты в плотном взаимодействии с бизнесом.

Чем предстоит заниматься:

  • Разрабатывать и развивать платформу данных электронной коммерции нового поколения;
  • Проектировать и реализовывать ETL-пайплайны в Airflow для Spark, Streaming, Hive, Trino;
  • Оптимизировать существующие пайплайны и Spark-джобы: следить за нагрузкой на кластер, ресурсами и производительностью;
  • Обеспечивать качество данных: развивать платформу Data Quality (чеки, мониторинг, алерты);
  • Взаимодействовать с аналитиками и ML-инженерами, оптимизировать SQL-запросы, развивать культуру осознанной работы с данными;
  • Развивать Action Storage — слой событий кликстрима, используемый в аналитике и моделях;
  • Анализировать и внедрять новые инструменты для эффективной работы с данными.

Мы ожидаем:

  • Опыт работы со стеком Hadoop (YARN, HDFS, HBase, Hive);
  • Уверенные навыки в Spark;
  • Опыт разработки на Python;
  • Отличное понимание SQL и принципов работы с СУБД;
  • Инженерный подход, интерес к системам данных и внимание к деталям.

Будет плюсом:

  • Опыт с Docker;
  • Знакомство с Kafka.
Навыки
  • Python
  • Big Data
  • Spark
  • Apache Hive
  • Hadoop
Посмотреть контакты работодателя

Похожие вакансии

Flowwow
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Платформа

Data Engineer

Платформа

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
АНО ЦИСМ

Data Engineer

АНО ЦИСМ

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Corporate Performance Systems

Data Engineer

Corporate Performance Systems

Удаленная работа
  • Москва

  • Не указана

Employcity

Data Scientist

Employcity

Удаленная работа
  • Москва

  • Не указана

Холдем

Data Analyst

Холдем

Удаленная работа
  • Москва

  • Не указана

Цементум Центр

Data Engineer (инженер данных)

Цементум Центр

Удаленная работа
  • Москва

  • Не указана

ИЦ АЙ-ТЕКО
Удаленная работа
  • Москва

  • Не указана

Outlines Technologies

Data инженер

Outlines Technologies

Удаленная работа
  • Москва

  • до 340000 RUR

Okkam
Удаленная работа
  • Москва

  • до 340000 RUR

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • до 340000 RUR

RR Group
Удаленная работа
  • Москва

  • до 3500 USD

Инвиста

Data Engineer

Инвиста

Удаленная работа
  • Москва

  • до 2000 USD

Компания БКС
Удаленная работа
  • Москва

  • до 2000 USD

Lamoda Tech
Удаленная работа
  • Москва

  • до 2000 USD

МАГ Девелопмент
Удаленная работа
  • Москва

  • до 2000 USD

IT-Implant
Удаленная работа
  • Москва

  • до 280000 RUR

Стрит Фалькон
Удаленная работа
  • Москва

  • от 200000 RUR

ГК Орбита
Удаленная работа
  • Москва

  • от 200000 RUR

Компания БКС

Data Scientist (Classic ML/NLP)

Компания БКС

Удаленная работа
  • Москва

  • от 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию