Разработка и сопровождение полного цикла обработки данных: от подключения источников и организации процессов загрузки до построения витрин данных для аналитики и BI-систем
Проектирование и реализация процессов интеграции, трансформации и очистки данных (ETL/ELT)
Прикладное администрирование и эксплуатация ETL-процессов и корпоративного хранилища данных (DWH)
Участие в формировании и развитии архитектуры платформы данных, подбор и внедрение инструментов (Airflow, dbt, PostgreSQL, Greenplum, ClickHouse и др.)
Поддержка и развитие текущей платформы (DataArts Studio), миграция и интеграция с целевыми решениями
Организация процессов разработки и контроля качества: версионирование, тестирование, мониторинг, документация
Взаимодействие с аналитиками, архитекторами и бизнес-подразделениями для понимания требований к данным и их реализации в хранилище
Что мы ожидаем:
Опыт работы с промышленными СУБД: Oracle, MS SQL, PostgreSQL или аналитическими СУБД (Teradata, Vertica, Greenplum и др.)
Отличные знания SQL: умение писать сложные запросы, выполнять оптимизацию и отладку
Владение Python для извлечения, трансформации и обработки данных
Понимание принципов построения DWH, ETL/ELT-процессов, основ моделирования данных
Опыт работы с системами управления разработкой (Git), инструментами планирования задач и мониторинга
Будет плюсом: опыт с Airflow, dbt, ClickHouse, а также участие в проектах по миграции данных или построению корпоративных DWH
Что мы предлагаем:
Комфортный офис на ст. м. Ботанический сад (2 мин от метро)
ДМС (со стоматологией)
Конкурентная заработная плата: фиксированный оклад + бонусы по результатам работы
Компенсация питания и мобильной связи
Тест-драйвы и корпоративные скидки
Возможность профессионального развития и роста в динамичной и быстроразвивающейся компании