ML Developer

Описание вакансии

Мы создаем следующее поколение продуктов на основе генеративного AI (LLM, RAG) и классического NLP.

Наша цель — не только исследовательские модели, но и их промышленная эксплуатация в масштабе.

Мы ищем опытного ML-разработчика, который будет проектировать, строить и поддерживать сложные, высокопроизводительные и отказоустойчивые системы машинного инференса, являющиеся фундаментом для наших AI-решений.

Обязанности:

  • Проектирование и разработка систем инференса:
    • Создание микросервисной архитектуры для обслуживания (Serving) LLM, эмбеддинг-моделей и реранкеров с низкой задержкой (low-latency) и высокой пропускной способностью (high-throughput).
    • Оптимизация пайплайнов инференса для масштабирования (горизонтального и вертикального) и обеспечения отказоустойчивости (high availability, fault tolerance).
    • Интеграция ML-сервисов с системами оркестрации (Kubernetes), очередями сообщений и API-гейтвеями.
  • Инжиниринг производительности и надежности (совместно с девопсами):
    • Проведение глубокого бенчмаркинга и профилирования инференса (использование GPU/CPU, память, задержки) для выявления узких мест.
    • Реализация стратегий батчинга, кэширования, динамической балансировки нагрузки и graceful degradation для критически важных сервисов.
    • Настройка мониторинга, алертинга и сбора метрик (латентность, ошибки, utilization) для ML-сервисов.
  • Дообучение и адаптация моделей для продакшена (совместно со специалистами по дообучению)
    • Адаптация и оптимизация (квантование, дистилляция, компиляция) LLM и других NLP-моделей для эффективного запуска в production-среде.
    • Организация пайплайнов дообучения (fine-tuning) с учетом требований к воспроизводимости и версионированию данных и моделей.
  • Поддержка и развитие ML-инфраструктуры (совместно с девопсами и специалистами обслуживания RAG систем):
    • Развитие и поддержка core-компонентов для RAG-систем (векторные базы, ретрайверы, реранкеры) с упором на их производительность и надежность.
    • Участие в формировании лучших практик (MLOps) для развертывания (CI/CD), мониторинга и управления версиями моделей.

Требования:​​​​​​​
  • Опыт работы ML-инженером / MLOps-инженером от 3 лет.
  • Высшее техническое образование (информатика, прикладная математика, Software Engineering).
  • Уверенное знание Python и его экосистемы для ML/инжиниринга.
  • Понимание принципов разработки высоконагруженных и отказоустойчивых распределенных систем.
  • Производственный опыт развертывания и обслуживания ML-моделей: Знание инструментов для serving'a (Ray Serve, Triton Inference Server, KServe, vLLM, TGI).
  • Глубокое знание инфраструктурного стека:
    • Контейнеризация и оркестрация: Продвинутый опыт с Docker и Kubernetes (Deployments, Services, HPA, ресурсные ограничения).
    • Мониторинг и логирование: Опыт настройки Prometheus, Grafana, ELK Stack для ML-сервисов.
    • Проектирование API: Разработка gRPC и REST API для ML-сервисов, понимание идемпотентности, стратегий retry.
    • Навыки оптимизации: Опыт профилирования и ускорения инференса (использование CUDA, TensorRT, ONNX Runtime, профайлеры типа PyTorch Profiler).
  • Опыт работы с полным циклом LLM/RAG (сильное преимущество):
    • Практический опыт промпт-инжиниринга, дообучения (fine-tuning, LoRA) и запуска инференса LLM.
    • Понимание и опыт реализации производительных и надежных RAG-архитектур (работа с векторными БД, оптимизация пайплайнов поиска и ранжирования).
  • Базовые знания Big Data-стэка (Spark) для обработки данных обучения.

Знание фреймворков глубокого обучения (например PyTorch) и библиотек (Transformers, Hugging Face).​​​​​​

Условия:
  • ​​​​трудоустройство в соответствии с ТК РФ
  • Заработная плата обсуждается по результатам собеседования и зависит от профессионального уровня кандидата
  • Премии - по результатам работы
  • Медицинское страхование (ДМС)
  • Возможность профессионального развития и карьерного роста
  • Офис в Москве, но работа удаленно.
  • Рабочий день с 10 до 18 часов.
Посмотреть контакты работодателя

Похожие вакансии

Про.Потолок

Senior ML Engineer / Data Scientist

Про.Потолок

Удаленная работа
  • Москва

  • до 350000 RUR

Рекомендуем
Invista
Удаленная работа
  • Москва

  • до 450000 RUR

Рекомендуем
А101
Удаленная работа
  • Москва

  • до 450000 RUR

Рекомендуем
Нейросетевые решения
Удаленная работа
  • Москва

  • до 450000 RUR

Нейрохакинг

AI / ML Engineer (EdTech)

Нейрохакинг

Удаленная работа
  • Москва

  • до 450000 RUR

СБЕР
Удаленная работа
  • Москва

  • до 450000 RUR

Сбер Бизнес Софт

Data Science / ML Engineer / NLP Engineer

Сбер Бизнес Софт

Удаленная работа
  • Москва

  • до 450000 RUR

RedLab
Удаленная работа
  • Москва

  • до 370000 RUR

МФК Фордевинд

ML-инженер

МФК Фордевинд

Удаленная работа
  • Москва

  • до 300000 RUR

Дартс рекрутинг сервисез

TechLead ML/CV Developer (MedTech)

Дартс рекрутинг сервисез

Удаленная работа
  • Москва

  • до 300000 RUR

Интернет-энциклопедия РУВИКИ

ML/DS инженер (рекомендательная система)

Интернет-энциклопедия РУВИКИ

Удаленная работа
  • Москва

  • до 300000 RUR

МТС
Удаленная работа
  • Москва

  • до 300000 RUR

РСХБ-Интех

Разработчик NLP

РСХБ-Интех

Удаленная работа
  • Москва

  • до 300000 RUR

МАГНИТ, Розничная сеть

ML Engineer Search

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • до 300000 RUR

Novakid Inc
Удаленная работа
  • Москва

  • от 5000 USD

VK
Удаленная работа
  • Москва

  • от 5000 USD

ВсеИнструменты.ру

Middle Python-разработчик (Backend + ML)

ВсеИнструменты.ру

Удаленная работа
  • Москва

  • от 5000 USD

Удаленная работа
  • Москва

  • от 250000 RUR

СБЕР
Удаленная работа
  • Москва

  • от 250000 RUR

ML-инженер (Inference Engineer)

Ананьева Оксана Васильевна

Удаленная работа
  • Москва

  • от 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию