Мы - крупнейший ритейлер в офлайне и онлайне в РФ.
Детмир-тех помогает Детскому миру, Зоозавру и ЕЩЁ становиться технологичнее.
В цифрах:
Сейчас мы ищем опытного Инженера данных в команду.
Что нужно делать?
- Проектирование, разработка и поддержка витрины данных
- Разработка алгоритмов выгрузки, обработки, хранения данных (ETL) из разных систем, интеграция с внешними системами
- Автоматизация процессов обновления данных
- Разработка правил и процедур контроля качества данных
- Помощь коллегам DA и DS
- Техническая поддержка наших инструментов
- Разворачивание helm chart
- Сборка docker образов
- Продуктивизация моделей машинного обучения от команды DS
Наш стек:
- Основной язык программирования Python (часть Spark Jobs написана на Scala)
- Apache Spark 3.5.1 & Streaming
- Apache Airflow
- Hadoop 3
- Apache Kafka
- ClickHouse
- JupyterHub
- Docker
- Kubernetes
- GitLab
- Grafana
Наши ожидания:
- Отличные знания SQL
- Знание языка Python (и/или Scala) на уровне разработчика от 3 лет
- Опыт создания и оптимизации Spark (PySpark) batch jobs
- Опыт работы с Airflow
- Отличное понимание устройства БД
- Опыт работы с Docker и Kubernetes
- Опыт участия в проектах построения DWH и Data Lake в роли ETL-разработчика от 3 лет
- Умение писать чистый поддерживаемый код и техническую документацию
- Будет плюсом опыт работы с форматом Iceberg и Spark Streaming
Мы предлагаем:
- Официальное оформление в соответствии с ТК РФ, полностью "белая" зп
- Оформление в аккредитованную ИТ компанию
- Высокий уровень заработной платы (обсуждается индивидуально, в зависимости от ваших ожиданий)
- Дружный коллектив
- Комфортный современный офис в районе мцк/мжд/метро Окружная (пешая доступность) или метро Петровско-Разумовская (10 минут на транспорте)
- График работы: 5/2, гибкое начало рабочего времени, работа в офисе или гибридный график (частично-удаленный формат работы) на выбор
- Расширенный полис ДМС
- Хорошая техническая оснащенность: Современный макбук