Москва
Метро: Охотный рядSenior ML Engineer (ASR/TTS), part‑time (4 часа/день)
О продукте. Мы строим голосового ИИ‑рекрутера: агент сам проводит короткие интервью‑скрининги, понимает кандидата в реальном времени и отвечает естественным «живым» голосом. Ниша быстро растёт; похожие решения (например, Mercor) уже подтверждают спрос рынком и инвестициями.
Образование и опыт
- Опыт работы с ASR и/или TTS системами (от 2–3 лет).
- Практический опыт внедрения и оптимизации моделей машинного обучения для обработки и генерации речи.
Задачи на роль (вы влияете на ядро продукта):
Спроектировать и запустить стриминговый ASR (RU/EN) с частичными гипотезами, устойчивостью к шуму/акцентам, прерываниям и корректным удержанием пунктуации.
Настроить TTS c «живой» просодикой (эмоции, темп, паузы), стриминговую генерацию и минимальную time‑to‑first‑audio (TTFT).
Добиться целевой E2E‑задержки разговорного цикла ≤ 500–700 мс при стабильном соединении.
Метрики/качество: WER/CER, MOS, RTTF; онлайн‑мониторинг и автотесты качества речи.
Инференс‑оптимизация: квантование/прунинг, ONNX Runtime/TensorRT, профилирование горячих путей.
Требования (must‑have):
Глубокие знания в области машинного обучения и глубоких нейронных сетей
Опыт работы с фреймворками PyTorch, TensorFlow, NumPy, SciPy
Опыт работы с инструментами и фреймворками для ASR/TTS (wav2vec2, Whisper, DeepSpeech, FastSpeech)
Опыт работы с NLP-пайплайнами: препроцессинг текста, нормализация, токенизация, языковые модели.
Понимание принципов работы стримингового распознавания речи.
Навыки оптимизации моделей, fine tuning.
Уверенные знания Python
Опыт работы с Docker / Kubernetes, CI/CD, MLOps.
Будет плюсом:
Опыт интеграции ASR/TTS в реальные продукты (чат-боты, голосовые ассистенты, мобильные приложения).
Навыки развертывания моделей в продакшене (REST/gRPC сервисы, оптимизация latency).
Способность работать как с исследовательскими задачами (R&D), так и с продакшн-развертыванием.
Условия:
График: 4 часа в день (удалённо), гибко по времени.
Оформление: обсуждаемо (самозанятость/ИП/ГПХ).
Оплата (0,5 ставки): от 150 000 до 200 000 ₽ «на руки» (Эквивалент 300–400 тыс. ₽ при full‑time).
Минимум бюрократии, продукт «с нуля» рядом с техлидом.
Как откликнуться: пришлите коротко (1) чем вы снижали latency в ASR/TTS, (2) пример метрик с последнего проекта (WER/MOS/RTTF), (3) ссылки на код/публикации/демо.
Москва
от 150000 RUR
Лаборатория Чистоты
Москва
от 1600 USD
Онлайн-Школа Психологии Котовой Елены
Москва
от 1600 USD