Мы ищем аналитика данных, который будет развивать витрины и поддерживать процессы работы с данными для аналитики и машинного обучения.
Предстоит решать задачи по обработке и интеграции данных, подготовке признаков для моделей и проверке гипотез на больших массивах данных.
Мы подходим друг другу, если вы хотите расти в аналитике и машинном обучении, умеете учиться на практике и цените аккуратность в работе с данными.
Задачи, которые предстоит решать:
- Мониторинг и оптимизация процессов сборки витрин данных;
- Загрузка и обработка данных из различных источников;
- Анализ данных, проверка гипотез, поиск закономерностей;
- Подготовка и расчёт признаков (feature engineering) для ML-моделей;
- Построение ML-моделей, оценка качества, тюнинг;
- Ведение документации по реализованным процессам.
Что важно знать и уметь
- Опыт работы с данными от 1 года;
- Отличное знание SQL;
- Навыки программирования на Python;
- Опыт работы с разными СУБД и построением витрин данных;
- Понимание принципов хранения и обработки данных;
- Базовые знания ML и желание развиваться в этой области;
- Владение основными командами Git.
Будет плюсом:
- Понимание принципов работы Hadoop и Spark;
- Опыт работы с Airflow;
- Опыт работы с ML и NLP (алгоритмы, настройка и тюнинг моделей, регистрация в MLFlow).
Личные качества:
- Умение находить несколько решений и доводить задачу до результата;
- Навыки тестирования своих решений;
- Способность работать самостоятельно и с нечётким ТЗ.
Условия:
- Окладная система оплаты труда;
- Ежегодный performance review: обсуждаем результаты, намечаем планы развития;
- Гибкий график с возможностью подстроить начало и конец рабочего дня;
- Возможность выбора формата работы – удаленный, гибрид или офис.