Python разработчик платформы DWH Маркета

Яндекс

Python разработчик платформы DWH Маркета

Описание вакансии

Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.

Команда платформы хранилища и аналитики разрабатывает инструменты для поставки, обработки и анализа больших данных. Наши пользователи — инженеры данных и аналитики. Технологически ядро хранилища построено на системах хранения данных YTsaurus, СlickHouse. Процессы ETL мы разрабатываем на собственном фреймворке Яндекса.

Наше хранилище — одно из самых крупных в России (порядка 35 петабайт), а с учётом темпов роста бизнеса оно будет самым крупным. Высокие требования по надёжности хранилища ставят перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.

Какие задачи вас ждут

Построение систем поставки данных
Вы будете строить отказоустойчивые и масштабируемые системы поставки данных, способные обрабатывать терабайты в сутки.

Работа с технологиями
Вам предстоит внедрять LLM для улучшения эффективности разработки хранилища и анализа, развивать фреймворк поставки и обработки данных, чтобы экономить время инженера данных, а также упрощать стек для аналитиков.

Повышение эффективности
Вам нужно будет повышать эффективность платформы, используя новые подходы и технологии: потоковую аналитику, поставку real-time и новые способы агрегации данных.

Мы ждём, что вы

  • Работали бэкенд-разработчиком с интеграциями и нагрузкой
  • Уверенно знаете Python, можете написать собственный фреймворк
  • Имеете опыт работы с заказчиками (сбор требований, ведение проектов)

Будет плюсом, если вы

  • Разрабатывали на С++, Java
  • Пользовались хотя бы одним MPP-хранилищем (Greenplum, ClickHouse, Vertica, Teradata и т. д.)
  • Взаимодействовали с LLM, знаете, что такое Agent, MCP
  • Знаете слои DWH, модели хранения данных, процессы ETL
  • Знакомы с основными структурами данных и алгоритмами (особенно для работы с большими данными)
  • Понимаете принципы работы хотя бы одной технологии распределённой обработки данных (Spark, Spark Streaming, Flink, MapReduce, ClickHouse, Greenplum)
  • Отлично знаете PostgreSQL с точки зрения разработчика
Навыки
  • Python
  • SQL
  • ETL
  • C++
Посмотреть контакты работодателя

Похожие вакансии

Яндекс
Полный день
  • Москва

  • Не указана

Рекомендуем
BAUM
Полный день
  • Москва

  • Не указана

Рекомендуем
Сбер Бизнес Софт
Полный день
  • Москва

  • Не указана

Рекомендуем
билайн
Полный день
  • Москва

  • Не указана

Домклик
Полный день
  • Москва

  • Не указана

Федеральное автономное учреждение Государственный Научно-Исследовательский Институт Авиационных Систем

Python-разработчик (Middle)

Федеральное автономное учреждение Государственный Научно-Исследовательский Институт Авиационных Систем

Полный день
  • Москва

  • Не указана

СберЛизинг

Разработчик Python AI

СберЛизинг

Полный день
  • Москва

  • Не указана

билайн
Полный день
  • Москва

  • Не указана

Ок Софт

Python Developer

Ок Софт

Удаленная работа
  • Москва

  • Не указана

MIND Software

Python Developer

MIND Software

Полный день
  • Москва

  • Не указана

Senior Python-разработчик

Платформа Трим

Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Backend-разработчик (Python)

Сычков Даниил Олегович

Удаленная работа
  • Москва

  • Не указана

EcoFinance
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

VK
Удаленная работа
  • Москва

  • Не указана

Транснефть-Технологии

NLP разработчик

Транснефть-Технологии

Полный день
  • Москва

  • Не указана

VK
Удаленная работа
  • Москва

  • Не указана

Леста Игры

Python Developer (Infrastructure)

Леста Игры

Полный день
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию