LLM/ML Engineer

Мэлон Фэшн Груп

LLM/ML Engineer

Санкт-Петербург, 11-я Красноармейская улица, 18-20

Метро: Балтийская

Описание вакансии

Обязанности:

  • Разработка, оптимизация и поддержка пайплайнов обучения и инференса LLM и ML моделей.
  • Интеграция LLM решений в бизнес-процессы (например, чат-боты, автоматизация коммуникаций, генерация описаний товаров, анализ клиентских обращений).
  • Настройка и поддержка инфраструктуры для деплоя LLM (GPU, FastAPI, Kubernetes, inference-слои).
  • Оптимизация моделей (quantization, distillation, sparsity), снижение стоимости и времени инференса.
  • Поддержка CI/CD процессов для ML/LLM пайплайнов, настройка мониторинга качества моделей.
  • Участие в проектировании feature stores и подготовке экспериментальных витрин (совместно с Data Scientists и Data Engineers).
  • Документирование архитектуры, подходов к деплою и best practices.
  • Взаимодействие с Data Engineering и бизнес-командами для масштабирования и поддержки решений.

Требования:

  • Опыт разработки ML/LLM решений и деплоя моделей в production — от 2 лет.
  • Отличное знание Python, включая ML/DL-стек (PyTorch, TensorFlow, Transformers, Hugging Face).
  • Опыт работы с LLM (fine-tuning, RAG, кастомизация под бизнес-задачи).
  • Глубокое понимание архитектуры inference пайплайнов (FastAPI, Triton Inference Server, ONNX).
  • Опыт работы с GPU (CUDA, управление нагрузкой, профилирование).
  • Понимание CI/CD для ML (Kubeflow, MLflow, Argo, GitLab CI).
  • Знание принципов мониторинга моделей (drift detection, логирование, метрики качества).
  • Опыт работы с объектными хранилищами (S3), Spark и Data Lake House архитектурой.

Будет плюсом:

  • Опыт оптимизации больших языковых моделей (LLM quantization, pruning, distillation).
  • Знание архитектуры real-time inference (low-latency приложения).
  • Опыт интеграции LLM в клиентские каналы (мессенджеры, CRM, e-commerce).
  • Понимание GDPR/ФЗ-152 и data privacy.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Мэлон Фэшн Груп

Data Scientist (ML/AI)

Мэлон Фэшн Груп

Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем
Okko
Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем

ML-инженер

Сапсан

Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Рекомендуем
YADRO
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

МАГНИТ, Розничная сеть

NLP-инженер / Machine Learning Engineer (NLP)

МАГНИТ, Розничная сеть

Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Мэлон Фэшн Груп

AI/ML архитектор (Tech Lead)

Мэлон Фэшн Груп

Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

BLACKHUB GAMES

Data Engineer

BLACKHUB GAMES

Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

YADRO
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Employcity
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Enjoypro
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

ИТ Проспект
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

Триколор
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

NAUMEN
Удаленная работа
  • Санкт-Петербург

  • до 300000 RUR

DCloud
Удаленная работа
  • Санкт-Петербург

  • до 250000 RUR

Диплей
Удаленная работа
  • Санкт-Петербург

  • до 250000 RUR

Дартс рекрутинг сервисез

Data Engineer

Дартс рекрутинг сервисез

Удаленная работа
  • Санкт-Петербург

  • до 240000 RUR

Газпром нефть

Data Engineer (Senior)

Газпром нефть

Удаленная работа
  • Санкт-Петербург

  • до 240000 RUR

Aston
Удаленная работа
  • Санкт-Петербург

  • до 80000 RUR

SDO
Удаленная работа
  • Санкт-Петербург

  • до 80000 RUR

INTELVISION

DevOps-инженер

INTELVISION

Удаленная работа
  • Санкт-Петербург

  • от 180000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию