Мы ищем Senior MLOps Engineer, который примет активное участие в создании надежной и маштабируемой платформы для разработки, внедрения и мониторинга ML моделей. Платформа предусматривает два режима работы - batch и real-time.
Наш стэк: k8s, Flux2, Airflow, Redis, Qdrant, ClearML, FastAPI, MongoDB, Spark, Kafka, Prometheus, Grafana.
Задачи:
- Создание MLOps-практик (стенды, DevOps, процессы) для задач запуска кампаний продаж, обработки аудиоконтента, исполнения LLM: среды разработки, тестирования, инференса и мониторинга моделей в различных режимах (Batch, Streaming) и использования ресурсов (CPU, GPU);
- Внедрение инструментов отслеживания жизненного цикла моделей и версионирования модельных артефактов (ClearML, MLFlow, DVC и т.п.);
- Развитие LLMOps-практик (эффективный инференс LLM для ChatGPT-like решений);
- Разработка Feature Store для моделей как компоненты Customer Data Platform;
- Помощь команде DS в выводом моделей в prod.
Требования:
- Опыт работы в качестве DevOps/MLOps/ML Engineer не менее 2 лет;
- Опыт работы с k8s, умение разрабатывать и поддерживать сервисы в этой среде;
- Опыт развертывания и использования MLOps инструментов (ClearML, DVC, MLflow и т.п.);
- Опыт выстраивания CI/CD, DAG пайплайнов для разработки/тестирования/инференса моделей/витрин;
- Опыт отладки Spark-job'ов, умение разбираться в ML-алгоритмах (бустинги, сетки, LLM, распределённые вычисления);
- Знание принципов организации распредёленных информационных систем и баз данных.
Будет плюсом:
- Теоретические и практические знания векторных баз данных (Qdrant, Milvus или аналогов);
- Опыт работы с Feature Store и обеспечения ежедневной работы потоков данных;
- Знания и опыт оптимизации GPU-инференса для LLM;
- Опыт разработки REST-сервисов.