Мы команда GigaChat — создаём и развиваем core-технологию генеративной языковой модели. Она может писать тексты, создавать изображения и даже код на Python. Она умеет отвечать на вопросы, вести диалог, сочинять стихи и рассказы, придумывать идеи для бизнеса, писать письма и многое другое. Наша команда осенью выпустила сильную русскоязычную модель GigaChat MAX уровня GPT-4 (метрики в статье), а этой зимой выложили в открытый доступ одну из наших MoE-моделей.
Что предстоит делать
- разрабатывать и улучшать эмбеддер-модели (encoder, cross-encoder и др.) для поиска релевантной информации
- строить и оптимизировать ранкер-модели для повышения качества выборки
- работать с большими массивами текстовых данных, включая как открытые, так и внутренние корпуса
- взаимодействовать с командами, развивающими генеративную часть GigaChat, чтобы сделать ответы модели более точными, полезными и контекстными.
Мы ожидаем, что у тебя есть
- опыт работы с NLP-задачами от 2 лет
- знание и практический опыт с современными ML/NLP-библиотеками: PyTorch, Transformers, FAISS, HuggingFace и др.
- понимание принципов работы retrieval-систем и архитектур вроде Dense Retrieval, BM25, ColBERT
- умение работать с LLM-пайплайнами, включая RAG
- опыт построения пайплайнов обучения/оценки моделей, метрик качества (nDCG, MRR, Precision@k)
- владение Python и умение писать чистый, поддерживаемый код.
Будет плюсом
- опыт работы с LLM в продакшене
- опыт участия в ML-ресёрче, публикации, участие в соревнованиях (Kaggle, NeurIPS и т.д.).
Условия
- комфортный современный офис рядом с м. Кутузовская
- возможность выбрать удобный график – офис/гибрид
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.