Наша исследовательская команда занимается разработкой и исследованием новейших решений в области речевых технологий с применением LLM-подходов. Мы работаем над прорывными проектами в сфере генерации речи, кодировщиков аудио и мультимодальных языковых моделей.
Основные направления работы:
• Мультимодальные эксперименты с GigaChat, DeepSeek, QWEN
• Fullduplex е2е подход в мультимодальных задачах
• Генерация произвольного голоса, инструктивное управление генерацией с помощью LLM
• Сбор и подготовка сложных датасетов и бенчмарков для аудио задач
Особенности позиции:
• Тесная синхронизация исследований с продуктовыми командами
• Возможность увидеть свои наработки в продакшене
• Возможность публиковать результаты исследований
• Работа с передовыми технологиями в области ИИ и речи
Требования:
• Глубокие знания в deep learning и обработке естественного языка
• Практический опыт в области обработки речи или аудио (желательно)
• Знакомство с современными LLM архитектурами и подходами, а также с мультимодальными архитектурами
• Хорошее понимание принципов работы речевых моделей
Будет преимуществом:
• Опыт исследовательской работы, а также научные публикации в области ML/NLP/Speech
• Участие в разработке открытых датасетов и бенчмарков
Что вы будете делать
• Разрабатывать и тестировать новые архитектуры моделей
• Участвовать в сборе и подготовке специализированных датасетов
• Создавать и улучшать бенчмарки для оценки качества моделей
• Адаптировать исследовательские наработки для продуктового применения
Условия:
• Гибкий график, удалённый формат работы
• Поддержку в публикации научных статей
• Баланс между исследованиями и практическим применением
Трубная Металлургическая Компания
Москва
от 4000 USD
Москва
от 4000 USD