MLOps Engineer

Описание вакансии

Мы в поисках инженера эксплуатации сервисов машинного обучения (MLOps).

Основные задачи будут сфокусированы на разработке и поддержке инструментов и инфраструктуры для полного жизненного цикла ML-решений, от экспериментов до промышленной эксплуатации, включая автоматизацию процессов и повышение надежности.

Эта роль предполагает плотное взаимодействие с ML, Data и Platform инженерными командами, а также участие в развитии внутренних стандартов и best practices.

Чем предстоит заниматься:

  • Разрабатывать и поддерживать инфраструктуры для экспериментов, обучения и деплоя ML-моделей в batch и online режимах;

  • Внедрять и развивать общие MLOps-инструменты: CI/CD пайплайны на базе GitLab, Model Registry, Feature Store, Data Quality, мониторинг моделей;

  • Поддерживать и развивать платформенные компоненты: кластеры, оркестрации, пайплайны обработки данных, системы развёртывания;

  • Взаимодействовать с командами Data Scientist, Data Engineering и Platform-инженерами для обеспечения стабильной и масштабируемой инфраструктуры;

  • Автоматизировать процессы с использованием IaC-подходов (Terraform, Ansible), Helm, Kubernetes;

  • Поддерживать и оптимизировать инфраструктуры в Yandex Cloud и Bare Metal;

  • Работать с системами обработки данных: Spark, Airflow, Trino, JupyterHub;

  • Участвовать в построении мониторинга и обеспечения качества данных и моделей.

Мы ожидаем:

  • Опыт разработки, внедрения и автоматизации ML или Data Egineering решений (от 1 года);

  • Понимание принципов CI/CD, разработки и эксплуатации распределённых систем;

  • Уверенный опыт работы с Kubernetes, Helm, Docker;

  • Практический опыт работы со Spark, Airflow;

  • Уверенное владение Python, Linux, методами работы с большими данными;

  • Опыт работы с инфраструктурным кодом (Terraform, Ansible);

  • Понимание основ алгоритмов машинного обучения;

  • Знание английского языка для работы с технической документацией.

Будет плюсом:

  • Опыт работы с Kubeflow, Trino, JupyterHub, Hadoop, Oracle;

  • Опыт настройки мониторинга (в том числе ML-моделей);

  • Опыт работы с Yandex Cloud.

Навыки
  • Kubernetes
  • Docker
  • Helm
  • Spark
  • Apache Airflow
  • Python
  • Linux
  • Terraform
  • Ansible
Посмотреть контакты работодателя

Похожие вакансии

Первый Бит
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Ecom.tech
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
edna
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
TEAMSCORE
Удаленная работа
  • Москва

  • Не указана

SL Soft
Удаленная работа
  • Москва

  • Не указана

Рунити
Удаленная работа
  • Москва

  • Не указана

Ростелеком Информационные Технологии

MLOps

Ростелеком Информационные Технологии

Удаленная работа
  • Москва

  • Не указана

Купер
Удаленная работа
  • Москва

  • Не указана

Интернет-энциклопедия РУВИКИ

AI-инженер

Интернет-энциклопедия РУВИКИ

Удаленная работа
  • Москва

  • Не указана

X5 Tech
Удаленная работа
  • Москва

  • Не указана

Лаборатория Касперского

DevOps Engineer (KFP)

Лаборатория Касперского

Удаленная работа
  • Москва

  • Не указана

Алфарма
Удаленная работа
  • Москва

  • Не указана

Callmedia
Удаленная работа
  • Москва

  • Не указана

Платформа автопутешествий Смородина

DevOps Engineer

Платформа автопутешествий Смородина

Удаленная работа
  • Москва

  • Не указана

KTS
Удаленная работа
  • Москва

  • Не указана

Эйайэксперт

DevOps Engineer

Эйайэксперт

Удаленная работа
  • Москва

  • Не указана

The Skolkovo Institute of Science and Technology

NLP Engineer LLM

The Skolkovo Institute of Science and Technology

Удаленная работа
  • Москва

  • Не указана

Удаленная работа
  • Москва

  • Не указана

МТС
Удаленная работа
  • Москва

  • Не указана

Интернет-энциклопедия РУВИКИ

DevOps инженер (SRE/L2)

Интернет-энциклопедия РУВИКИ

Удаленная работа
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию