Мы — AI-команда, работающая на стыке науки и бизнеса. Мы создаём
передовые AI-решения, интегрируя большие языковые модели (LLM) в ключевые процессы компании. Одна из наших технологий — GigaChat, но мы не ограничиваемся только им: экспериментируем с моделями LLaMA, Mistral, GPT, Falcon и другими.
Мы не просто разрабатываем прототипы, но и внедряем наши решения в реальную работу сотрудников и клиентов по всей стране.
Основные направления:
• AI Агенты для автоматизированного определения тематик обращений через различные каналы обращения
• AI Агенты для автоматизированного определения корневых причин обращений через различные каналы обращения
• AI Агенты для автоматизированного самарризации и формирования рекомендаций по полученным обращениям через различные каналы обращения
•Создание пользовательского интерфейса для получения результата анализа ОС на основе диалогового чат бота без навыков hard skill у конечного пользователя системы
Обязанности:
• Проведение исследований и проверка гипотез с использованием LLM в прикладных
бизнес-задачах, генерация идей по дальнейшему развитию продуктов.
• Разработка и внедрение продуктов на основе NLP-моделей (Text Classification,
Summarization, QA, Text Ranking, Language Modeling).
• Интеграция современных фреймворков для создания LLM-решений, таких как
LangChain и GigaChain, а также эксперименты с prompt-tuning и динамической
генерацией промтов.
• Оптимизация векторного поиска с FAISS, Pinecone, Weaviate и интеграция его в LLM-
системы и системы оценки качества.
• Разработка новых подходов и процессов разметки данных для оценки качества работы
LLM-моделей совместно с исследователями и бизнес-заказчиками, включая RLHF
(обучение с подкреплением с участием человека).
• Оптимизация пайплайна исполнения на CPU/GPU инфраструктуре с использованием
vLLM, FlashInfer, DeepSpeed, Nvidia Triton Inference Server, ZeRO.
Что нужно знать и уметь:
✅ Опыт работы с LLM-моделями (GigaChat, YandexGPT, GPT, LLaMA, Mistral, Falcon и
др.).
✅ Владение Python, PyTorch, Hugging Face Transformers и умение писать чистый и эффективный код.
✅ Знание основ fine-tuning трансформеров и адаптивного обучения (LoRA, QLoRA).
✅ Опыт работы с векторными БД (FAISS, Pinecone, Weaviate).
✅ Понимание процессов MLOps (развёртывание, мониторинг, CI/CD, Docker, Kubernetes).
✅ Опыт работы с Git, SQL, API.
Условия работы:
1. Уникальные масштабные проекты, работа в приоритетном направлении.
2. Достойная заработная плата (оклад + годовая премия).
3. Современные рабочие места и программное обеспечение.
4. Выгодные условия по ипотеке и кредитованию.
5. Бесплатная подписка СберПрайм+.
6. Скидки на продукты компаний-партнёров (Okko, СберМаркет, Delivery Club,
Самокат, СберЕаптека и другие).
7. ДМС с первого дня и льготное страхование для близких.
8. Корпоративная пенсионная программа.
9. Обучение за счёт компании: онлайн-курсы, доступ к библиотеке, корпоративный
университет, тренинги, митапы и повышение квалификации.
Москва
до 250000 RUR
Москва
до 250000 RUR