ML / LLM Engineer

Production IT

ML / LLM Engineer

Москва

Метро: Библиотека им.Ленина

Описание вакансии

Команда Production IT растет и развивается.

Мы в поисках новых направлений и никогда не стоим на месте, поэтому нам в команду необходим вдумчивый и ответственный профессионал.

Обязанности:

  • Реализация и поддержка RAG-пайплайна для AI-ассистента

  • Подготовка и структурирование .md документации для индексации

  • Подбор и тестирование LLM (Qwen, Llama, Solar, Saiga и др.) под разные бизнес-кейсы

  • Оптимизация по:

    • потреблению памяти

    • скорости инференса

    • качеству решения узкоспециализированных задач

  • Prompt engineering, переформулирование запросов

  • Построение дашбордов в Grafana

  • Работа с InfluxDB

  • Метрики качества и производительности моделей

  • Работа с LangGraph (state + nodes)

  • Логирование и трейсинг через LangSmith

  • Реализация ML API на FastAPI

  • Structured output от LLM

  • Работа с Redis Streams

  • Разворачивание моделей (CPU / GPU, vLLM)

  • Контейнеризация через Docker-compose

  • Обучение модели детекции layout документов (0.85 mAP)

  • Обучение и тестирование NER

  • Обучение моделей детекции текста на MMOCR

  • Работа с ResNet18, YOLOv7

  • Рефакторинг и переработка API (Django, 3 сервиса)

  • Оценка качества изображений: шум, размытие, перспектива

  • Обучение кастомной модели классификации шрифтов и стилей текста

Ожидаем от кандидата

  • Практический опыт построения RAG-архитектур

  • Опыт работы с LLM в production

  • Понимание принципов инференса (GPU/CPU, vLLM)

  • Уверенный Python (FastAPI / Django)

  • Опыт обучения CV/NLP моделей

  • Понимание метрик качества (mAP, F1, precision/recall)

  • Опыт контейнеризации (Docker)

  • Опыт построения ML-сервисов с логированием и мониторингом

Будет плюсом:

  • Опыт работы с банковскими или финтех-проектами

  • Опыт оптимизации инференса под ограниченные ресурсы

  • Опыт работы с пайплайнами переобучения

Условия:
  • рост ЗП, в зависимости от результатов
  • через полгода возможность взять оплачиваемый отпуск
  • работа как самозанятому или через ИП по договору
  • стандартный график по будням, не считая праздники.
Навыки
  • Python
  • Django Framework
  • Docker
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Staffberry

ML-инженер

Staffberry

  • Москва

  • Не указана

Рекомендуем
Онлайн-школа Тетрика

ML Engineer

Онлайн-школа Тетрика

  • Москва

  • Не указана

Рекомендуем
Интерфакс

ML - инженер (СКАН)

Интерфакс

  • Москва

  • Не указана

Рекомендуем
РТ
  • Москва

  • Не указана

Aston

ML Engineer

Aston

  • Москва

  • Не указана

Про.Потолок

Senior ML Engineer / Data Scientist

Про.Потолок

  • Москва

  • до 350000 RUR

Специализированный депозитарий ИНФИНИТУМ

Machine Learning Lead engineer

Специализированный депозитарий ИНФИНИТУМ

  • Москва

  • до 350000 RUR

Городской информационный центр Инфосити

Разработчик/инженер машинного обучения/ML Engineer

Городской информационный центр Инфосити

  • Москва

  • до 250000 RUR

Лига Ставок

ML Engineer (RecSys)

Лига Ставок

  • Москва

  • до 250000 RUR

Lamoda Tech
  • Москва

  • до 250000 RUR

HeadHunter
  • Москва

  • до 250000 RUR

МФК Фордевинд

Middle/Senior ML-инженер

МФК Фордевинд

  • Москва

  • до 350000 RUR

СП Солюшен
  • Москва

  • до 350000 RUR

AnyClass

Data Engineer

AnyClass

  • Москва

  • от 250000 RUR

МТС
  • Москва

  • до 300000 RUR

HeadHunter
  • Москва

  • до 300000 RUR

Amex Development

ML-инженер

Amex Development

  • Москва

  • от 230000 RUR

Aston
  • Москва

  • от 230000 RUR

Go Invest

LLM инженер

Go Invest

  • Москва

  • от 230000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию