Data Engineer

Описание вакансии

Продукт — корпоративное хранилище данных для всей группы компаний. Находимся в поиске Дата инженера для усиления команды.

Стек: Debezium, Kafka, Python, MS SQL, Schema Registry, Apache Flink, Apache Paimon, Apache Iceberg, MinIO/S3, Parquet/Avro, Airflow, SODA, dbt, Trino, ClickHouse, Docker/Kubernetes, Git/CI-CD.

Задачи:

  • Проектирование, развертывание и сопровождение архитектуры данных на основе концепций Lakehouse и Streamhouse;
  • Интеграция потоковых и пакетных данных в единую унифицированную платформу аналитики;
  • Разработка и поддержка конвейеров данных (data pipelines) как для batch-, так и для stream-обработки;
  • Оптимизация хранения данных в форматах, поддерживающих ACID-транзакции и высокую производительность (например, Delta Lake, Apache Iceberg, Apache Hudi);
  • Взаимодействие с аналитиками, разработчиками и инженерами;
  • Настройка мониторинга, алертинга и управления метаданными в рамках lakehouse-инфраструктуры.

Ожидания:

  • Опыта в Data Engineering от 2-ух лет;
  • Практический опыт с Debezium, Kafka, Flink или другой стрим-фреймворк (Spark Streaming, Kafka Streams), Python;
  • Написание запросов SQL на продвинутом уровне,
  • Знание форматов хранения и таблиц с поддержкой транзакций: Delta Lake, Apache Iceberg, Apache Hudi;
  • Базовое понимание CDC, streaming vs batch, ACID в lakehouse.
  • Опыт работы с Airflow, Docker, Git, CI/CD.

Будет большим плюсом:

  • Знакомство с Schema Registry.
  • Практика с Trino/Presto, ClickHouse, dbt.
  • Участие в построении data platform с нуля (даже в pet-проекте).

Условия:

  • Своевременная "белая" заработная плата (2 раза в месяц на банковскую карту);
  • Работа в команде профессионалов над интересными и сложными проектами;
  • Официальное трудоустройство и социальные гарантии с первого дня работы;
  • Удаленная работа из любого региона по часовому поясу МСК.

Просим вас в сопроводительном письме указать ваши ожидания по заработной плате. Спасибо)

Навыки
  • Python
  • Debezium
  • MS SQL
  • Apache Kafka
  • Apache Flink
  • Trino
  • Parquet
  • Apache Airflow
  • dbt
  • Clickhouse
  • Docker
  • CI/CD
  • DWH
Посмотреть контакты работодателя

Похожие вакансии

WILDBERRIES

Data Engineer

WILDBERRIES

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Flowwow
Удаленная работа
  • Москва

  • от 270000 RUR

Рекомендуем
РУНЕТ БИЗНЕС СИСТЕМЫ

AI Engineer

РУНЕТ БИЗНЕС СИСТЕМЫ

Удаленная работа
  • Москва

  • от 270000 RUR

Рекомендуем
1001 LABS

Data Engineer

1001 LABS

Удаленная работа
  • Москва

  • от 270000 RUR

ARK
Удаленная работа
  • Москва

  • от 300000 RUR

AUXO (Атос АйТи Солюшенс энд Сервисез)

Data Engineer

AUXO (Атос АйТи Солюшенс энд Сервисез)

Удаленная работа
  • Москва

  • от 300000 RUR

NEXTEPIC

Data Engineer

NEXTEPIC

Удаленная работа
  • Москва

  • от 300000 RUR

Дата Дженерейшн

Data Engineer

Дата Дженерейшн

Удаленная работа
  • Москва

  • до 350000 RUR

Алфарма
Удаленная работа
  • Москва

  • до 350000 RUR

Честный знак.рф
Удаленная работа
  • Москва

  • до 350000 RUR

Ит-Финанс

Senior Data Analyst

Ит-Финанс

Удаленная работа
  • Москва

  • до 350000 RUR

Ozon
Удаленная работа
  • Москва

  • до 350000 RUR

Удаленная работа
  • Москва

  • от 2000 USD

Data Engineer

Кидс Аппс

Удаленная работа
  • Москва

  • от 2000 USD

RateXAi Scoring Systems (ИП Гусев Юрий Михайлович)

Senior Data Engineer (Web3)

RateXAi Scoring Systems (ИП Гусев Юрий Михайлович)

Удаленная работа
  • Москва

  • до 5000 USD

АО «ОТП Банк» (JSC «OTP Bank»)
Удаленная работа
  • Москва

  • до 5000 USD

Аналитик данных/Data Analyst

Edge Capital Management LLC

Удаленная работа
  • Москва

  • до 5000 USD

Алонг
Удаленная работа
  • Москва

  • до 5000 USD

Мокка
Удаленная работа
  • Москва

  • до 5000 USD

Progressive Mind

Senior DevOps engineer

Progressive Mind

Удаленная работа
  • Москва

  • до 3000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию