Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке 19 лет. Наша компания стабильно развивается и работает в усиленном режиме: использует современный стек и новейшие технологии, разрабатывает множество новых hi-tech продуктов.
Сейчас мы ищем Senior Data Scientists в команду Core LLM. Основная задача - приносить пользу различным продуктам внутри WB, благодаря построению переиспользуемых решений. В моменте фокусируемся на карточках товаров и работаем в связке с командами Рекомендаций, Антифрода и Поиска.
Что нужно делать
- Заниматься тюнингом LLM под русский язык и задачи WB;
- Исследовать различные архитектуры нейронных сетей и их применимость к решению задач маркетплейса;
- Доучивать LLM для автоматизации тех.поддержки;
- Создавать векторные представления товаров и пользователей для персонализации рекомендаций, поиска, рекламы;
- Решать задачи машинного перевода;
- Решать задачи с использованием самых актуальных технологий и достижений в машинном обучении, читать и имплементировать наработки из научных статей.
Какой опыт и знания нужны
- Опыт работы с LLM, дообучением GPT-like моделей;
- Знание PyTorch, Numpy, Sklearn, transformers;
- Опыт классической ML разработки одной или нескольких типов моделей: Text classification, NER, QA, machine translation;
- Умение ориентироваться в алгоритмах и структурах данных;
- Опыт построения систем с использованием RAG (Retrieval-Augmented Generation) подхода.
Мы предлагаем
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Инфраструктура: Мощные GPU-кластеры, петабайты данных;
- Развитие: Конференции, курсы, внутренние митапы;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.