MLOps

Описание вакансии

Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс услуг по разработке и внедрению программных решений.

Каждый день на наших проектах задействовано 4200+ сотрудников, у нас 70+ направлений разработки различных решений. За 11 лет нашей работы мы успешно реализовали более 60 ИТ-продуктов.

О проекте:

Мы создаем передовую платформу, которая позволяет эффективно обучать, тонко настраивать и разворачивать крупномасштабные языковые модели (LLM) и другие NLP-решения. Наша цель — предоставить командам исследователей и бизнес-пользователям инструментарий для работы с современными моделями ИИ в условиях ограниченного доступа к облачным ресурсам.

Чем предстоит заниматься:

- Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixal и др) для инференса в production среде;
- Внедрение продуктов на основе NLP моделей;
- Оптимизация текущих решений с акцентом на производительность и управление нагрузкой (onnx, openvino, tensorrt);
- Оптимизация пайплайна в исполненения на CPU/GPU инфраструктуре с использованием VLLM, Nvidia Triton Server;
- Исследование и прототипирование фреймворков и моделей в области Generative AI.

Что мы ожидаем:

- Опыт в оптимизации инференса (vllm, Triton Inference Server, аналоги);
- Уверенное знание Python и опыт разработки сетевых/асинхронных приложений;
- Опыт Деплоя ML-моделей в production (Docker, K8S, FastAPI/Gradio)
- Внедрения и оценки эффективности решений на основе современных NLP моделей в роли ведущего или лида проекта;

Будет плюсом, но не обязательно:- Знание Docker, CI/CD, и SQL, с готовностью разрабатывать решения с нуля;
-Опыт работы с LLM-моделями;
- Опыт работы с экосистемой Huggin Face (Transformers, PEFI, TRL)
- Знание основ face-tunning трансформеров и адаптивного обучения (Lora, QLora)
- Опыт участия в проектах по внедрению Gen AI-решений.

Мы предлагаем:

- Удаленный или гибридный формат работы;
- Возможность принимать участие в конференциях, проходить обучение за счет компании;
- Полностью "белая" заработная плата: оклад + годовая премия;
- Кафетерий льгот, который искренне любят наши сотрудники;
- График работы гибкий: начало работы с 08:00 до 10:00 МСК, окончание - с 17:00 до 19:00 МСК, Сб-Вс – выходные.

Посмотреть контакты работодателя

Похожие вакансии

ГНИВЦ

MLOps

ГНИВЦ

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Компания БКС

MLOps (Senior)

Компания БКС

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
DatsTeam
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
HeadHunter
Удаленная работа
  • Москва

  • Не указана

Звук

Team Lead MLOps

Звук

Удаленная работа
  • Москва

  • Не указана

HeadHunter
Удаленная работа
  • Москва

  • Не указана

Napoleon IT

MLops engineer

Napoleon IT

Удаленная работа
  • Москва

  • Не указана

WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

СОГАЗ

MLOps specialist

СОГАЗ

Удаленная работа
  • Москва

  • Не указана

Альфа-Банк

Senior Mlops/DevOps

Альфа-Банк

Удаленная работа
  • Москва

  • Не указана

Электронная торговая площадка Газпромбанка

Senior MLOps

Электронная торговая площадка Газпромбанка

Удаленная работа
  • Москва

  • Не указана

РСХБ-Интех
Удаленная работа
  • Москва

  • Не указана

МАГНИТ, Розничная сеть

DevOps/MLOps инженер

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • Не указана

Электронная торговая площадка Газпромбанка

Middle MLops specialist

Электронная торговая площадка Газпромбанка

Удаленная работа
  • Москва

  • Не указана

Ozon
Удаленная работа
  • Москва

  • Не указана

Точка Банк

MLOps-инженер

Точка Банк

Удаленная работа
  • Москва

  • до 550000 RUR

WILDBERRIES
Удаленная работа
  • Москва

  • до 550000 RUR

Lamoda Tech

MLOps Engineer

Lamoda Tech

Удаленная работа
  • Москва

  • до 550000 RUR

МТС
Удаленная работа
  • Москва

  • до 550000 RUR

Нетология
Удаленная работа
  • Москва

  • до 550000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию