Наша исследовательская команда занимается разработкой и исследованием новейших решений в области речевых технологий с применением LLM-подходов. Мы работаем над прорывными проектами в сфере генерации речи, кодировщиков аудио и мультимодальных языковых моделей.
• Мультимодальные эксперименты с GigaChat, DeepSeek, QWEN
• Fullduplex е2е подход в мультимодальных задачах
• Синхронный перевод речи
• Генерация произвольного голоса, инструктивное управление генерацией
• Сбор и подготовка сложных датасетов и бенчмарков для аудио задач особенности позиции
• Тесная синхронизация исследований с продуктовыми командами
• Возможность увидеть свои наработки в продакшене
• Возможность публиковать результаты исследований
• Работа с передовыми технологиями в области ИИ и речи
• Глубокие знания в deep learning и обработке естественного языка
• Практический опыт в области обработки речи или аудио (желательно)
• Знакомство с современными LLM архитектурами и подходами, а также с мультимодальными архитектурами
• Хорошее понимание принципов работы речевых моделей
Москва
до 6000 USD
Яндекс
Москва
до 6000 USD
Москва
до 6000 USD
NM TEAM SOCIAL MEDIA APPLICATIONS DEVELOPMENT & MANAGEMENT CO. L.L.C
Москва
от 350000 RUR
Москва
от 350000 RUR
Электронная торговая площадка Газпромбанка
Москва
от 350000 RUR