Наша команда превращает терабайты данных в понятные и полезные инсайты, которые используют аналитики и сервис, помогающий миллионам людей путешествовать. Наш продукт растёт огромными темпами, и вместе с ним растут наши задачи, например развитие собственного DWH.
Хранилище у нас построено на системах хранения данных YTsaurus (кластер MapReduce собственной разработки) и СlickHouse. Для разработки, оркестрации и мониторинга ETL-процессов используется собственный фреймворк, созданный внутри Яндекса. Для организации модели хранения данных на разных уровнях применяются различные методологии проектирования хранилищ данных: Lambda-архитектура, Data Lake, Data Vault.
Какие задачи вас ждут
Разработка, сопровождение и ревью ETL-процессов поставки данных
Вам предстоит создавать конвейеры для извлечения, трансформации и загрузки данных из различных источников, настраивать их расписание и мониторинг. Важно будет регулярно проверять и улучшать существующий код, оперативно исправлять возникающие ошибки, а также тщательно документировать все преобразования и потоки данных — как собственные, так и коллег, обеспечивая соответствие стандартам качества и производительности.
Проектирование структуры хранения данных в разных слоях хранилища
Вы будете определять оптимальные схемы организации данных для каждого слоя, учитывая требования к скорости запросов и объёму хранения. Задача включает разработку моделей данных, настройку партиционирования, индексации и сжатия для повышения производительности, а также согласование структур с командами аналитики и разработки и адаптацию схем при изменении бизнес процессов.
Выявление и оптимизация неэффективных участков в процессах поставки данных
Вам нужно будет анализировать время выполнения ETL задач, профилировать данные для обнаружения аномалий и избыточности, пересматривать алгоритмы трансформации для снижения нагрузки на систему.
Погружение в данные прикладных бизнес-областей и становление в них экспертом
Вы будете детально изучать бизнес процессы и ключевые метрики компании, разбираться в логике расчёта показателей и источниках их формирования.
Мы ждем, что вы
Будет плюсом, если вы
СПб ГКУ Санкт-Петербургский информационно-аналитический центр
Санкт-Петербург
Не указана
Росинжиниринг, Компания
Санкт-Петербург
от 170000 RUR
Алабуга, ОЭЗ ППТ
Санкт-Петербург
от 277000 RUR
ЭВРИКА, Санкт-Петербург
Санкт-Петербург
до 240000 RUR
Газпром нефть
Санкт-Петербург
до 240000 RUR
СПб ГУП «АТС Смольного»
Санкт-Петербург
до 140000 RUR
Триплюс-Инжиниринг
Санкт-Петербург
до 200000 RUR