Инженер данных DWH в ФинТех

Яндекс

Инженер данных DWH в ФинТех

Москва, Садовническая улица, 82с2

Метро: Павелецкая

Описание вакансии

Мы обрабатываем большие объёмы данных, и нам нужно делать это быстро и точно. Для этого мы создаём масштабную, безопасную и удобную аналитическую платформу. Нам требуются дата-инженеры для разработки DWH.

Какие задачи вас ждут

  • Доработка внутренней платформы

Вы будете развивать внутреннюю платформу управления данными: автоматизировать рутинные задачи, такие как деплой простых решений и мониторинг, а также улучшать инструменты самообслуживания для аналитиков. Вам предстоит работать с Kafka, ClickHouse, Spark Streaming и внутренними инструментами разработки.

  • Разработка и поддержка витрин данных

Вы будете разрабатывать, оптимизировать и поддерживать витрины данных, исходя из требований бизнеса и аналитиков. Это включает проектирование структуры данных, реализацию ETL-пайплайнов с использованием Python, Spark, Greenplum и Airflow, а также обеспечение их эффективной работы. Вам предстоит решать задачи разного уровня сложности — от простых трансформаций до обработки больших объёмов данных с нетривиальной бизнес-логикой.

  • Оптимизация ETL-процессов

Вам предстоит оптимизировать ETL-процессы, чтобы повысить производительность и снизить затраты. Нужно проанализировать и устранить проблемы, такие как перекос данных в Greenplum, долгие джобы и неэффективные партиции, а также настроить распределение ресурсов в кластере.

  • Мониторинг качества данных

Вы будете разрабатывать и поддерживать систему мониторинга качества данных, включая DQ-проверки и алерты на аномалии. Также вам предстоит анализировать и устранять сбои в поставке данных, такие как пробелы, дубли и некорректные значения. Кроме того, вы будете взаимодействовать с аналитиками и бизнес-пользователями, чтобы повысить прозрачность поставки данных.

Мы ждем, что вы

  • Пишете код на Python
  • Работали с базами данных SQL и NoSQL
  • Знакомы с брокерами сообщений (Kafka, RabbitMQ или чем-то подобным)
  • Работали с инструментами Hadoop

Будет плюсом, если вы

  • Работали со Spark или Spark SQL
  • Работали с Greenplum
  • Умеете разрабатывать DAG для Airflow
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Яндекс
Полный день
  • Москва

  • Не указана

Рекомендуем
Рокетбанк

Data Engineer

Рокетбанк

Полный день
  • Москва

  • Не указана

Рекомендуем
WILDBERRIES
Полный день
  • Москва

  • Не указана

Рекомендуем
WILDBERRIES
Полный день
  • Москва

  • Не указана

М.Видео-Эльдорадо
Удаленная работа
  • Москва

  • Не указана

BORK
Полный день
  • Москва

  • Не указана

Яндекс
Полный день
  • Москва

  • Не указана

Банк ВТБ (ПАО)
Полный день
  • Москва

  • Не указана

Леста Игры
Полный день
  • Москва

  • Не указана

РСХБ-Интех

Data Engineer

РСХБ-Интех

Удаленная работа
  • Москва

  • Не указана

Тера Интегро

Data engineer (ETL)

Тера Интегро

Полный день
  • Москва

  • Не указана

ТПС Недвижимость

Разработчик DWH, ETL

ТПС Недвижимость

Полный день
  • Москва

  • Не указана

НефтеТрансСервис

Инженер данных / Data engineer

НефтеТрансСервис

Удаленная работа
  • Москва

  • Не указана

Bell Integrator

Инженер MLOps

Bell Integrator

Полный день
  • Москва

  • Не указана

Компания БКС
Удаленная работа
  • Москва

  • Не указана

ТРАНСКАПИТАЛБАНК

Разработчик витрин данных

ТРАНСКАПИТАЛБАНК

Полный день
  • Москва

  • Не указана

В Кадре
Удаленная работа
  • Москва

  • до 220000 RUR

Центральный банк Российской Федерации (Банк России)

Data Engineer

Центральный банк Российской Федерации (Банк России)

Полный день
  • Москва

  • до 220000 RUR

Coleman Group

Data Engineer

Coleman Group

Удаленная работа
  • Москва

  • до 350000 RUR

Flowwow
Удаленная работа
  • Москва

  • от 270000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию