Проект: Gaia Inc. (американская стриминговая платформа, конкурент Netflix)
О проекте:
Мы развиваем data-направление для Gaia — платформы с миллионами пользователей. Сейчас ищем специалиста, который поможет строить и поддерживать data-инфраструктуру, ETL-процессы и аналитические решения.
Что предстоит делать:
Разрабатывать и поддерживать ETL-процессы (сбор, очистка, трансформация данных).
Работать с Big Data-стеком (Hive, Presto, Spark, Snowflake и др.).
Участвовать в проектировании Data Lake / Data Warehouse.
Автоматизировать процессы с помощью Airflow или аналогов.
Взаимодействовать с командой и бизнесом, чтобы понимать их data-потребности.
(Для кандидатов с аналитикой/DS) — помогать с дашбордами, метриками, ML-моделями (если есть опыт).
Что ждём от кандидата:
Обязательно:
5+ лет опыта в Data Engineering, Analytics Engineering или Data Science (с инженерной частью).
Python + SQL на уверенном уровне.
Опыт с ETL, Data Pipeline или обработкой больших данных.
Знание хотя бы одного инструмента из Big Data (Hive, Spark, Presto, Hadoop и т. д.).
Английский язык C1 (команда англоязычная)
Желательно (плюсы):
Опыт с Airflow, Domo, AWS (S3, EC2, RDS).
Знание CI/CD, мониторинга и алертинга.
Навыки визуализации данных (дашборды, отчёты).
Базовое понимание ML (если бэкграунд в DS).
Опыт работы в стриминговых/медийных проектах.
Что предлагаем:
Интересные задачи в международном проекте (Gaia — аналог Netflix).
Возможность влиять на архитектуру данных.
Гибкий поиск: рассматриваем как Data Engineers, так и аналитиков/DS с инженерными навыками.
Работа в американском часовом поясе.
Санкт-Петербург
Не указана
Санкт-Петербург
до 3500 EUR
Объединенные Пивоварни
Санкт-Петербург
до 370000 RUR
Санкт-Петербург
от 200000 RUR
Санкт-Петербург
от 220000 RUR