DWH Инженер

Описание вакансии

Проект — построение и развитие Хранилища Данных "Магнит Маркет"

Основные задачи — развитие существующего фреймворка загрузки сырьевых данных и построение витрин над ними, развитие Дата Каталога, движка Data Quality.

Наш стек

  • Greenplum и ClickHouse, как DWH.
  • Airflow+DBT как оркестратор задач.
  • Python для дагов и операторов в AF.
  • Kafka и Debezium — основной инструмент поставки данных в хранилище.
  • Yandex Cloud как место работы всех наших сервисов.
  • DBT как основа дата каталога и шаблонизатор SQL.

Чем предстоит заниматься
В первые три месяца

  • Погрузиться во фреймворки загрузки данных и расчета витрин на основе задач по одному из направлений
  • Освоиться в предметной области данных.
  • Проводить code review аналитиков с целью использования ими лучших технических решений и оптимизации производительности

Когда освоишься

  • Создавать новые паттерны загрузки данных и расчета витрин для дальнейшего переиспользования
  • Развивать модель данных
  • Рефакторить текущие процессы, предлагать лучшие практики работы с данными

Что нужно, чтобы к нам присоединиться

  • Знать особенности MPP-систем.
  • Уверенно владеть SQL (Оконные функции, партицирование, агрегации, оптимизация запросов, понимание плана запроса).
  • Иметь опыт с Python достаточный для разработки операторов в Airflow(ООП) и написания пайплайнов данных из различных источников.
  • Понимать принципы работы Airflow (даги, таски, операторы, сенсоры, хуки, контекст).

Будет плюсом

  • Опыт в Greenplum и/или ClickHouse (особенно шардированный)
  • Опыт с Kafka

Что предлагаем

  • Очень интересный сложный продукт с большим количеством пользователей
  • Формат работы: полная удаленка, при желании — гибрид/офис
  • Оформление в IT-компании, аккредитованной в Министерстве цифрового развития
  • ДМС
Посмотреть контакты работодателя

Похожие вакансии

X5 Tech
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
ARK
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

Рекомендуем

Data Engineer

ДелоТех

Удаленная работа
  • Москва

  • Не указана

SkillStaff
Удаленная работа
  • Москва

  • Не указана

Стрит Фалькон
Удаленная работа
  • Москва

  • от 200000 RUR

МФК Саммит
Удаленная работа
  • Москва

  • от 200000 RUR

Точка
Удаленная работа
  • Москва

  • до 360000 RUR

Corporate Performance Systems

Data Engineer

Corporate Performance Systems

Удаленная работа
  • Москва

  • до 360000 RUR

Bell Integrator

Аналитик DWH

Bell Integrator

Удаленная работа
  • Москва

  • до 360000 RUR

АйТиИ Экспо Интернешнл

Data Engineer/Инженер данных

АйТиИ Экспо Интернешнл

Удаленная работа
  • Москва

  • до 360000 RUR

Lamoda Tech
Удаленная работа
  • Москва

  • до 360000 RUR

Selecty
Удаленная работа
  • Москва

  • до 360000 RUR

Hi, Rockits!

DS/ML engineer

Hi, Rockits!

Удаленная работа
  • Москва

  • до 360000 RUR

Selecty
Удаленная работа
  • Москва

  • до 360000 RUR

Диджитал Лайн

Data engineer (Middle+/Senior)

Диджитал Лайн

Удаленная работа
  • Москва

  • от 250000 RUR

HeadHunter
Удаленная работа
  • Москва

  • от 250000 RUR

билайн
Удаленная работа
  • Москва

  • от 250000 RUR

VK
Удаленная работа
  • Москва

  • от 250000 RUR

ГК Орбита
Удаленная работа
  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию