Обязанности:
Проектирование и поддержка масштабируемого хранилища данных (data warehouse)
Разработка ETL‑процессов для интеграции данных из различных источников
Оптимизация производительности баз данных, обеспечение целостности и актуальности данных
Взаимодействие с аналитиками и стейкхолдерами: сбор требований и их реализация в архитектуре данных
Применение лучших практик моделирования, хранения и управления данными
Диагностика и устранение проблем в работе ETL‑процессов и БД
Соблюдение стандартов безопасности и соответствие требованиям по защите данных
Требования:
Высшее образование в области информационных технологий, прикладной математики, компьютерных наук
Опыт работы от 2 лет в роли Data Engineer
Уверенное владение SQL (сложные запросы, индексация, оптимизация)
Опыт работы с архитектурой хранилищ данных и разработкой ETL
Знание реляционных СУБД: PostgreSQL, MySQL и др.
Понимание концепций моделирования данных (звёздная схема, снежинка и др.)
Умение анализировать и решать технические задачи
Опыт работы с Python и Apache Airflow
Опыт работы с ClickHouse, Snowflake, Redshift или BigQuery
Опыт интеграции данных через Apache Kafka
Навыки работы с GIT
Английский язык на уровне, достаточном для ведения профессиональной переписки
Будет плюсом:
Навыки скриптования на Bash
Опыт работы с PySpark
Опыт работы в Agile-командах
Мы предлагаем:
Работа в международной продуктовой команде
Полностью удалённый формат
Конкурентная заработная плата
Гибкий график
Участие в масштабных проектах и возможность влиять на архитектурные решения
Возможности для профессионального роста
Москва
до 160000 RUR