Мы — GigaChat Alignment. Делаем модель полезной и надёжной: SFT/DPO, дистилляция в маленькие модели, LoRA-сервис, метрики и валидирующие пайплайны. Быстро проверяем гипотезы, ускоряем обучение и выкатываем улучшения в прод — сначала для внутренних клиентов, потом для всей России.
Направления
Улучшение SFT / DPO: тестирование новый подходов к обучению, ускорение пайплайнов, генерация новых данных, дистиляция знаний из больших LLM в маленькие.
Развитие метрик качества GigaChat-а, например, через оценку способности решать задачи олимпиад международного уровня. Развитие внутреннего LLM-AS-A-JUDGE
Разработка сервиса Lora обучения GigaChat и GigaEmbeder. Повышение стабильности и воспроизводимости запусков, создание пайплайнов валидации и генерации данных с помощью ЛЛМ.
На эти роли мы ищем талантливого NLP Engineer, с которым будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.
СПб ГКУ Санкт-Петербургский информационно-аналитический центр
Санкт-Петербург
от 260000 RUR
ГК ВИЗАВИ Консалт
Санкт-Петербург
от 400000 RUR
Saber Interactive
Санкт-Петербург
до 230000 RUR
СПб ГКУ Санкт-Петербургский информационно-аналитический центр
Санкт-Петербург
до 270000 RUR