Senior STT & TTS Engineer (Uzbek voice)

InFinBank

Senior STT & TTS Engineer (Uzbek voice)

Ташкент, улица Тараса Шевченко, 1

Описание вакансии

Рады сообщить: Мы в поисках ведущего специалиста, который будет работать над системами автоматического распознавания речи (ASR) и синтеза речи (TTS). Ожидаем от будущего кандидата участие в выборе, обучении моделей, а также в настройке пайплайнов для inference в real-time.

Скоуп тасков:
• Разработка и оптимизация моделей ASR и/или TTS (на базе open-source и кастомных решений)
• Исследование и внедрение моделей на базе Whisper, NeMo, Vosk, FastSpeech, Tacotron и др.
• Обработка аудиоданных: препроцессинг, очистка, аугментации
• Оптимизация latency, обеспечение real-time inference
• Интеграция моделей в сервисы (API, gRPC, FastAPI)
• Мониторинг качества (WER, MOS и др.), A/B тестирование
• Обучение/Дообучение Моделей на данных
• Менторство в рамках команды

Требования:
• Опыт работы с задачами ASR и/или TTS в ML-продуктах
• Уверенное знание Python, PyTorch / TensorFlow
• Опыт с open-source решениями (Whisper, ESPNet, Mozilla TTS, Coqui, etc.)
• Знание алгоритмов работы с аудио: FFT, MelSpectrogram, MFCC и т.п.
• Навыки оптимизации inference (ONNX, quantization, streaming)
• Понимание задач real-time распознавания
• Опыт от 2-3 года в ML или DS проектах с голосом

Будет плюсом:
• Опыт развертывания моделей в реальном времени (в т.ч. на GPU / edge)
• Опыт с NeMo, HuggingFace Audio, Transformers (TTS/ASR модули)
• Работа с облачными STT/TTS API и кастомизация поверх них

АКБ "InFinBank" открывает широкие профессиональные перспективы для своих сотрудников:
• Корпоративное обучение за счёт работодателя
• Гибкость формата работы
• Возможность влияния на развитие проектов одного из крупнейшего банка UZ с 4+ млн. пользователей
• Команда, где ценится экспертиза, инициативность и инженерная культура
• Возможность карьерного роста
• Доход выше среднего по локальному рынку труда и индивидуально обсуждаем с каждым отдельным специалистом

Навыки
  • ASR
  • Speech-To-Text
  • Text-To-Speech
  • Python
  • TensorFlow
  • open-source
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию