Мы ищем опытного Data Scientist в команду разработки WB Space — платформы для проведения ML-соревнований. В этой роли вы будете разрабатывать ML-проекты соревнований, лучшие решения которых смогут масштабироваться в продуктовые ML-модели и использоваться в реальных бизнес-процессах. Это позволит привлекать сильных специалистов и напрямую влиять на ключевые бизнес-показатели компании.
Чем предстоит заниматься
- Разрабатывать ML-задачи для соревнований, учитывая бизнес-потребности;
- Подбирать и разрабатывать метрики оценки для ML-соревнований;
- Консультировать заказчиков по постановке задач и выбору метрик;
- Создавать baseline-решения и анализировать данные, применяя подходящие алгоритмы ML;
- Визуализировать результаты и представлять их команде;
- Формировать задачи, конечным решением которых будет Docker-образ;
- Поддерживать участников на всех этапах соревнований;
- Взаимодействовать с вузами, курировать студенческие проекты и образовательные инициативы.
Какой опыт и знания нужны
- Глубокие знания алгоритмов и структур данных;
- Уверенное владение Python (NumPy, Pandas, Scikit-learn, PyTorch/TensorFlow);
- Сильный математический бэкграунд в линейной алгебре, вероятности и статистике;
- Глубокое понимание классического машинного обучения и основ Deep Learning;
- Опыт обучения и дообучения нейросетей на PyTorch;
- Практический опыт работы с задачами NLP, Time Series, CV, RecSys (от 2 лет);
- Опыт контейнеризации и работы с Docker;
- Навыки инференса моделей, разработки и деплоя ML-сервисов.
Будет плюсом
- Опыт преподавания или ведения образовательной практики в области машинного обучения;
- Опыт выкатки моделей в production;
- Опыт работы с большими данными, применения распределённых вычислений;
- Опыт решения задач Classification, Object Detection, Segmentation, Anomaly Detection, OCR.
Наш стек
Python, Go, ClearML, Prometeus, Grafana, Docker, PyTorch, Airflow, Postgres, Clickhouse, K8s, FastAPI, Gitlab, PyTorch, Tensorflow, ONNX
Мы предлагаем
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.