Мы в поиске Data Scientist в команду A/B Platform.
Чем предстоит заниматься:
-
Развитие методологии A/B-тестирования (снижение дисперсии, исследование прокси-метрик);
-
Построение масштабируемого пайплайна расчета метрик и A/B репортов - конфигурирование метрик и срезов, реализация расчета и применение стат методов для оценки значимости (в связке с дата-инженером):
-
Улучшение процесса A/B-тестирования в компании - от дизайна эксперимента до валидации и принятия решения.
Стэк технологий: Big data (Hadoop, PySpark, Hive), Python, SQL, Power BI, Airflow, Docker.
Почему у нас классно:
- Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
- Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
- У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.
Мы ожидаем:
Будет плюсом:
- Знание эконометрики;
- Опыт работы с библиотекой statsmodels;
- Умение простым языком объяснить коллегам, что такое p-value и почему нельзя запускать АВ-тест без подсчета MDE;
- Опыт работы продуктовым аналитиком, опыт решения продуктовых задач
Как мы работаем:
- Пишем на Python 3.10 и PySpark 3.3.1
- Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
- Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
- Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
- В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
- Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
- В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.