Руководство проектированием, разработкой и оптимизацией ML-конвейеров для решений на основе STT, TTS и LLM;
Подстройка моделей распознавания речи и языковых моделей для языков и диалектов с низкими ресурсами;
Сотрудничество с командой аннотации данных для обеспечения качества данных для обучения моделей;
Преобразование ML моделей и прототипов в готовые к производству конвейеры;
Оптимизация производительности моделей для достижения точности, скорости и эффективности;
Автоматизация ключевых этапов CI/CD-конвейеров для развертывания ML моделей;
Наставничество младших инженеров по машинному обучению и руководство командой по лучшим практикам кодирования, управления моделями и MLOps;
Документация процессов, написание спецификаций и разработка пользовательских руководств для ML моделей и конвейеров;
Обеспечение соблюдения стандартов конфиденциальности данных и безопасности моделей.
Более 5 лет опыта в области машинного обучения или роли MLE;
Подтвержденный опыт в проектах STT, TTS или NLP;
Глубокие знания LLM и настройка моделей для низкоресурсных языков;
Уверенное владение библиотеками ML на Python (TensorFlow, PyTorch, HuggingFace, TensorFlow и др.);
Опыт интеграции ML моделей в сложные, основанные на данных системы;
Знание облачных провайдеров (AWS, GCP, Azure) и платформ MLOps (AWS SageMaker, MLFlow, Kubeflow и др.);
Опыт управления конвейерами аннотации данных и обеспечения качества данных;
Сильные коммуникационные и лидерские навыки.
Будет плюсом:
Опыт работы с фреймворками ASR (Wav2vec, Kaldi, SpeechBrain, Whisper и др.);
Компетенции в экосистеме Apache Airflow;
Знакомство с фреймворками TTS (VITS, XTTS, Coqui TTS, Tacotron и др.);
Опыт работы в многоязычном NLP (настройка многоязычных моделей);
Знания технологий распознавания диалектов;
Компетенции в экосистеме Apache Spark;
Экспертиза в LLM/Generative AI моделях.
Условия:
Ташкент
до 6000000 UZS