Мы создаём большой Data Lake, собирающий данные всех продуктов внутри VK. Основная цель аналитиков и инженеров Data Platform — собрать DWH с необходимым набором core дата-сетов, которые будут решать любые задачи кросс-продуктового взаимодействия.
Аналитику данных предстоит заниматься также построением эвристик/сегментаций, чтобы наиболее гибко фильтровать по интересам наших пользователей.
Задачи
- Коммуникации с контрагентами из бизнес-юнитов для сбора требований к таблицам, витринам, процессам или data-продуктам разрабатываемой платформы
- Анализ, поиск аномалий, фильтрация таблиц в разнородном Data Lake
- Предобработка и нормализация данных
- Взаимодействие с командой дата-инженеров для сборки пайплайнов ETL
- Сбор агрегатов для поиска различных инсайтов, создание BI-отчётности
Требования
- Опыт работы аналитиком данных от двух лет
- Опыт работы с данными с помощью базовых инструментов (SQL, Python + базовые библиотеки, любой BI-инструмент)
- Системное мышление, умение быстро разбираться в новых системах, процессах и понятно объяснить другим
- Умение применять математическую статистику, теорию вероятностей и базовый матанализ для решения задач бизнеса
- Понимание основных принципов построения DWH
- Проактивность, любовь к данным, работе с ними, желание строить крутые дата-решения
Будет плюсом
- Навыки DE
- Опыт работы с YTsaurus