Наша исследовательская команда занимается разработкой и исследованием новейших решений в области речевых технологий с применением LLM-подходов. Мы работаем над прорывными проектами в сфере генерации речи, кодировщиков аудио и мультимодальных языковых моделей.
Основные направления работы
• Мультимодальные эксперименты с GigaChat, DeepSeek, QWEN
• Fullduplex е2е подход в мультимодальных задачах
• Генерация произвольного голоса, инструктивное управление генерацией с помощью LLM
• Сбор и подготовка сложных датасетов и бенчмарков для аудио задач
Обязанности
- Разрабатывать и тестировать новые архитектуры моделей
- Участвовать в сборе и подготовке специализированных датасетов
- Создавать и улучшать бенчмарки для оценки качества моделей
- Адаптировать исследовательские наработки для продуктового применения
Требования
- Глубокие знания в deep learning и обработке естественного языка
- Практический опыт в области обработки речи или аудио (желательно)
- Знакомство с современными LLM архитектурами и подходами, а также с мультимодальными архитектурами
- Хорошее понимание принципов работы речевых моделей
Будет преимуществом
- Опыт исследовательской работы, а также научные публикации в области ML/NLP/Speech
- Участие в разработке открытых датасетов и бенчмарков
Условия
- Достойная заработная плата + бонус
- Гибкий график, удалёнку
- Поддержку в публикации научных статей
- Баланс между исследованиями и практическим применением