RecSys Lab — это R&D-команда в направлении рекомендаций Wildberries. Мы фокусируемся на исследованиях и разработке новых подходов в рекомендательных системах, тестируем нетривиальные гипотезы и предлагаем свежий взгляд на текущие решения.
Наш приоритет — прикладной ресёрч: мы активно следим за научными публикациями и внедряем инновационные идеи в продакшн. Наша цель — сделать процесс внедрения новых перспективных идей в продукты максимально быстрым и эффективным.
Сейчас мы ищем опытного ML-специалиста, который присоединится к нашей команде и будет участвовать в поиске и тестировании новых перспективных подходов.
Чем предстоит заниматься
- Экспериментировать с новыми DL-архитектурами и совершенствовать существующие;
- Изучать и отбирать перспективные идеи на основе графовых моделей, Seq2Seq-архитектур, CV, LLM из свежих статей;
- Создавать MVP-решения на основе публикаций, адаптируя их под специфику Wildberries;
- Проводить комплексные эксперименты и исследования;
- Анализировать общие проблемы рекомендательных систем (position/popularity bias, feedback loop, корреляция онлайн и офлайн метрик);
- Сотрудничать с другими ML-инженерами, аналитиками и продуктовыми командами для проверки гипотез;
- Делиться результатами и участвовать в масштабировании решений во всем направлении.
Что для нас важно
- Глубокое понимание работы нейросетей и умение объяснить их работу "под капотом";
- Широкий кругозор в современном машинном обучении;
- От 3+ лет промышленного опыта в обучении/файнтюне NLP/RecSys или смежных задачах (поиск, мэтчинг) в большом продукте с миллионами пользователей и товаров;
- Отличное владение Pytorch;
- Исследовательский склад ума и интерес к экспериментам;
- Способность работать с научными статьями и внедрять идеи на практике;
- Умение чётко представлять результаты исследований.
Также будет плюсом
- Ученая степень в области рекомендательных систем (RecSys) или глубокого обучения (DL);
- Специализация в одной из областей DL: CV или NLP/LLM;
- Опыт работы с BigData-стеком (Hadoop, Pyspark);
- Опыт организации или участия в научных Reading Club;
- Победы на ML-хакатонах и конкурсах, публикации на Habr или топовых конференциях (NeurIPS, ICML, CVPR).
Почему у нас круто
- R&D среда: большую часть времени мы экспериментируем над новейшими подходами, а не занимаемся поддержкой давно зарекомендовавших себя "классических" решений;
- Реальное влияние на продукт: наши исследования могут быстро перейти в продакшн и влиять на опыт миллионов пользователей Wildberries;
- Дружная команда и сильная аналитическая культура: мы постоянно читаем и анализируем свежие статьи и выступления, участвуем в брейнштормах и делимся знаниями друг с другом;
- Разнообразие направлений и доменов данных: с нами есть возможность работать как с разными необычными Seq2Seq-архитектурами, так и CV, графами, NLP, RL, LLM;
- Масштаб и ресурсы: крупные датасеты, доступ к мощным вычислительным кластерам.
Мы предлагаем
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.