Data Engineer DWH

Описание вакансии

Мы обрабатываем большие объёмы данных, и нам нужно делать это быстро и точно. Для этого мы создаём масштабную, безопасную и удобную аналитическую платформу. Нам требуются дата-инженеры для разработки DWH.

Какие задачи вас ждут

Доработка внутренней платформы
Вы будете развивать внутреннюю платформу управления данными: автоматизировать рутинные задачи, такие как деплой простых решений и мониторинг, а также улучшать инструменты самообслуживания для аналитиков. Вам предстоит работать с Kafka, ClickHouse, Spark Streaming и внутренними инструментами разработки.

Разработка и поддержка витрин данных
Вы будете разрабатывать, оптимизировать и поддерживать витрины данных, исходя из требований бизнеса и аналитиков. Это включает проектирование структуры данных, реализацию ETL-пайплайнов с использованием Python, Spark, Greenplum и Airflow, а также обеспечение их эффективной работы. Вам предстоит решать задачи разного уровня сложности — от простых трансформаций до обработки больших объёмов данных с нетривиальной бизнес-логикой.

Оптимизация ETL-процессов
Вам предстоит оптимизировать ETL-процессы, чтобы повысить производительность и снизить затраты. Нужно проанализировать и устранить проблемы, такие как перекос данных в Greenplum, долгие джобы и неэффективные партиции, а также настроить распределение ресурсов в кластере.

Мониторинг качества данных
Вы будете разрабатывать и поддерживать систему мониторинга качества данных, включая DQ-проверки и алерты на аномалии. Также вам предстоит анализировать и устранять сбои в поставке данных, такие как пробелы, дубли и некорректные значения. Кроме того, вы будете взаимодействовать с аналитиками и бизнес-пользователями, чтобы повысить прозрачность поставки данных.

Мы ждем, что вы

  • Пишете код на Python
  • Работали с базами данных SQL и NoSQL
  • Знакомы с брокерами сообщений (Kafka, RabbitMQ или чем-то подобным)
  • Работали с инструментами Hadoop

Будет плюсом, если вы

  • Работали со Spark или Spark SQL
  • Работали с Greenplum
  • Умеете разрабатывать DAG для Airflow

Что мы предлагаем

  • Сильную команду, с которой можно расти
  • Сложные задачи для сервисов с миллионами пользователей
  • Возможность влиять на процесс и результат
  • Зарплату на уровне рынка и выше
  • Премии каждые полгода за эффективную работу
  • Ипотечные программы: под 3% на 10 лет или без процентов на три года
  • Компенсацию оплаты питания
  • Расширенную программу ДМС: оплату 80% стоимости ДМС для супругов и детей
  • Спортзал, тренажёрный зал, йогу в офисе
  • Гибкий график работы
  • Парковку
  • иногородним помогаем с переездом.
Посмотреть контакты работодателя

Похожие вакансии

Яндекс
Полный день
  • Санкт-Петербург

  • Не указана

Рекомендуем
Леста Игры

Data Engineer

Леста Игры

Полный день
  • Санкт-Петербург

  • Не указана

Рекомендуем
СБЕР

Data Engineer

СБЕР

Полный день
  • Санкт-Петербург

  • Не указана

Рекомендуем
BLACKHUB GAMES

Data Engineer

BLACKHUB GAMES

Удаленная работа
  • Санкт-Петербург

  • Не указана

Яндекс
Полный день
  • Санкт-Петербург

  • Не указана

Полный день
  • Санкт-Петербург

  • Не указана

Метр квадратный
Полный день
  • Санкт-Петербург

  • Не указана

Цементум Центр

Data Engineer (инженер данных)

Цементум Центр

Удаленная работа
  • Санкт-Петербург

  • Не указана

LuckyGroup

Data Engineer

LuckyGroup

Полный день
  • Санкт-Петербург

  • Не указана

Криптонит

Data Engineer (Senior/Middle)

Криптонит

Полный день
  • Санкт-Петербург

  • Не указана

Концепт Разработка

Разработчик DWH / Дата инженер

Концепт Разработка

Удаленная работа
  • Санкт-Петербург

  • Не указана

СБЕР
Полный день
  • Санкт-Петербург

  • Не указана

Evercode Lab

Data Engineer

Evercode Lab

Полный день
  • Санкт-Петербург

  • Не указана

STARTRIBE LTD

Data Analyst

STARTRIBE LTD

Полный день
  • Санкт-Петербург

  • Не указана

Quadcode

Data Engineer

Quadcode

Полный день
  • Санкт-Петербург

  • Не указана

Полный день
  • Санкт-Петербург

  • Не указана

BI Consult
Полный день
  • Санкт-Петербург

  • Не указана

Леста Игры
Полный день
  • Санкт-Петербург

  • Не указана

Центральный банк Российской Федерации (Банк России)

Техдид Дата-инженер (потоковые данные)

Центральный банк Российской Федерации (Банк России)

Полный день
  • Санкт-Петербург

  • Не указана

ГЕРОФАРМ

Data Engineer

ГЕРОФАРМ

Полный день
  • Санкт-Петербург

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию