LLMOps / ML Platform Engineer

Юкитех Лаб

LLMOps / ML Platform Engineer

Описание вакансии

LLMOps / ML Platform Engineer (Self-Hosted LLM)

О компании

Мы —продуктовая IT-команда, разрабатывающая собственные информационные системы. Работаем с современным технологическим стеком и микросервисной архитектурой. В связи с развитием продукта ищем LLMOps / ML Platform Engineer, который разработает нам сервисы для LLM и оптимизирует их работу на «железе».

Задачи

  • Разработка и поддержка продакшен-сервисов под собственную LLM (backend / API / internal services), системы синтеза и распознавания речи, оптимизация инференса отдельных компонентов и системы в целом для NRT эксплуатации
  • Построение и развитие DevOps-pipeline для ML-сервисов: сборка, деплой, обновления, мониторинг; внедрение и развитие практик MLOps:
    • CI/CD для ML-сервисов
    • наблюдаемость (логи, метрики, трассировка)
    • управление версиями и релизами моделей
  • Контейнеризация решений и эксплуатация в Kubernetes (AWS + on-prem).
  • Совместная работа с backend-командой.

Требования обязательные:

  • Опыт коммерческой разработки от 3 лет.
  • Уверенное владение Python, SOLID, многопоточная и асинхронная разработка, оптимизация сервисов на Python под быстродействие.
  • Опыт разработки серверных сервисов (REST/gRPC).
  • Понимание жизненного цикла ML/LLM решений в продакшене; понимание подходов оптимизации ML-пайплайнов для инференса
  • Понимание особенностей основных архитектур и пайплайнов NN/ML решений, прежде всего в области ASR, TTS, LLM; понимание разницы между real-time и batch инференсом;
  • Практический опыт Docker и контейнеризации
  • Опыт работы с GPU (деплой, конфигурация, эксплуатация); наличие решений в продакшен

Требования желательные:

  • Опыт эксплуатации ML-сервисов в AWS и/или on-prem.
  • Работа с monitoring/observability (Prometheus, Grafana, OpenTelemetry и аналоги).
  • Опыт оптимизации inference-нагрузок (batching, caching, resource tuning).
  • Опыт реализации CI/CD для ML-проектов.
  • Знакомство с vLLM/llama.cpp/TGI, Triton/TorchServe, Onnx

Условия

  • Удалённая работа, полная занятость.
  • Продакшен-задачи, влияние на архитектуру и инфраструктурные решения.
  • Конкурентная зарплата (готовы обсуждать по опыту).
Навыки
  • Python
  • LLMOps
  • ML Platform Engineer
Посмотреть контакты работодателя

Похожие вакансии

Aston

AI Engineer

Aston

  • Санкт-Петербург

  • Не указана

Рекомендуем
  • Санкт-Петербург

  • до 250000 RUR

Рекомендуем
Честный знак.рф

DevSecOps инженер

Честный знак.рф

  • Санкт-Петербург

  • до 250000 RUR

Рекомендуем
ЦКТ
  • Санкт-Петербург

  • до 250000 RUR

Пивоварни Бочкарев

DevOPS/SRE инженер

Пивоварни Бочкарев

  • Санкт-Петербург

  • до 250000 RUR

СимбирСофт
  • Санкт-Петербург

  • до 250000 RUR

High Sky
  • Санкт-Петербург

  • до 250000 RUR

HuntIT
  • Санкт-Петербург

  • до 250000 RUR

Axiom JDK
  • Санкт-Петербург

  • до 250000 RUR

Live Typing
  • Санкт-Петербург

  • до 310000 RUR

Радиовэйв
  • Санкт-Петербург

  • от 220000 RUR

Софтвайс
  • Санкт-Петербург

  • до 366000 RUR

DevOps-инженер

Колле Степан Александрович

  • Санкт-Петербург

  • до 200000 RUR

CRT
  • Санкт-Петербург

  • от 200000 RUR

Maxim technology
  • Санкт-Петербург

  • от 200000 RUR

Честный знак.рф
  • Санкт-Петербург

  • от 200000 RUR

СПб ГКУ Санкт-Петербургский информационно-аналитический центр

Middle ML Engineer

СПб ГКУ Санкт-Петербургский информационно-аналитический центр

  • Санкт-Петербург

  • от 200000 RUR

Диплей
  • Санкт-Петербург

  • от 200000 RUR

Saber Interactive
  • Санкт-Петербург

  • от 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию