Команда занимается исследованиями и разработками (R&D) в области речевых технологий. Мы создали один из лучших в России классических синтезаторов речи и сейчас сосредоточены на исследовании больших языковых моделей (LLM) с речевыми интерфейсами. Наши ключевые направления включают разработку full-duplex моделей (модели, ведущей диалог голосом в режиме реального времени, непрерывно слушая себя и собеседника), моделей синхронного перевода, создание говорящих LLM, управляемых текстовыми инструкциями, а также, развитие масштабного пайплайна сбора данных.
⦁ уверенные знания Python и алгоритмов глубокого обучения
⦁ опыт работы с фреймворками распределённого обучения
⦁ опыт работы с большими языковыми моделями (LLM): pretrain, SFT, alignment
⦁ знание и понимание методов RL: PPO, DPO, DRPO или GRPO
Будет плюсом:
⦁ знания современных речевых технологий, методов токенизации аудио
⦁ опыт работы с аудио. Классическая цифровая обработка сигнала. Является плюсом, но не обязателен (готовность к самостоятельному изучению)
Москва
Не указана
Москва
Не указана
Москва
Не указана
Москва
Не указана