Data Engineer

Описание вакансии

Мы — команда из 10 инженеров, ответственных за разработку и поддержку высоконагруженной внутренней платформы для обработки диалоговых данных LLM и AI агентов.

Технологический стек:

Обработка данных: Apache Spark, Hadoop (HDFS, YARN)

Оркестрация: Apache Airflow

Потоковая передача данных: Apache Kafka

Кэширование и вычисления: Apache Ignite

Логи: ELK Stack (Elasticsearch, Logstash, Kibana)

Визуализация: Apache Superset

Инфраструктура: CI/CD (BitBucket/Jenkins), k8s, Linux

Обязанности

разрабатывать, оптимизировать и поддерживать ETL/ELT процессы в Apache Spark для построения витрин данных
интегрировать компоненты платформы с использованием Apache Kafka и Apache Ignite
поддерживать и развивать текущую архитектуру данных, обеспечивать ее отказоустойчивость и производительность
разрабатывать и поддерживать DAG в Apache Airflow
настраивать и поддерживать CI пайплайны для Big Data-сервисы

Требования

не менее 3 лет опыта коммерческой разработки ETL на Apache Spark (Core, SQL)
практический опыт работы с Apache Airflow и Hadoop (HDFS, YARN)
опыт построения и поддержки CI пайплайнов (Jenkins или аналог)

Будет плюсом:

опыт работы с Apache Kafka, Apache Ignite
знание ELK-стека, Apache Superset

Условия

комфортный современный офис рядом с м. Кутузовская
гибридный формат работы – 1 раз в неделю в офисе
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека для сотрудников выгоднее до 4%
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.