Мы — трайб SberWorks.
Кластер MLOps отвечает за технологическую реализацию процессов производства ML-моделей. Кластер объединяет команды методологов, экспертов в области машинного обучения и разработчиков инструментов, которые обеспечивают эффективное внедрение и эксплуатацию ML-решений.
Мы ищем талантливого и опытного Архитектора MLOps, который сможет выстроить технически современную, удобную и прозрачную практику MLOps, оказывающую влияние на весь Сбер.
Наша задача - построить удобное, технологичное, быстрое и максимально автоматизированное производство моделей машинного обучения.
Наша цель - сделать максимально эффективный в стране MLOps.
Обязанности
- Проектирование и внедрение MLOps-платформы:
- разработка и внедрение инфраструктуры для обучения, развертывания и мониторинга ML-моделей
- создание end-to-end pipelines для автоматизации процессов машинного обучения (CI/CD для ML)
- Оптимизация процессов:
- автоматизация процессов обучения, тестирования и переобучения моделей
- интеграция инструментов для управления данными, моделями и их версионированием (MLflow, Kubeflow и др.)
- Масштабирование и надежность:
- обеспечение масштабируемости ML-решений для работы с большими объемами данных
- гарантия высокой доступности и отказоустойчивости ML-систем
- Мониторинг и управление моделями:
- внедрение систем мониторинга качества моделей в production (выявление дрейфа данных, degradation модели)
- разработка стратегий для автоматического переобучения моделей
- Сотрудничество с командами:
- тесное взаимодействие с Data Scientists, ML Engineers, инженерами данных и DevOps для создания эффективных ML-решений.
- обучение команд лучшим практикам MLOps.
- Безопасность и соответствие стандартам:
- обеспечение безопасности процесса производства моделей в соответствии с требованиями организации.
Требования
- Образование и опыт:
- высшее образование в области IT, или математики
- опыт работы в области MLOps, DevOps, Data Science или ML Engineer от 3 лет
- успешный опыт внедрения проектирования с нуля, разработки и внедрения систем уровня Business Critical
- опыт работы в высоконагруженных проектах будет преимуществом
- Технические навыки:
- глубокое понимание процессов машинного обучения и Data Science
- опыт работы с облачными платформами (AWS, GCP, Azure) и их сервисами для ML (SageMaker, Vertex AI, Azure ML)
- знание инструментов MLOps (MLflow, Kubeflow, TFX, Airflow, и др.)
- опыт работы с контейнеризацией и оркестрацией (Docker, Kubernetes)
- навыки программирования на Python, Bash, SQL
- понимание MLOps-практик и CI/CD.
Условия
- офис БЦ "Даниловский форт" (м.Нагатинская)
- возможность выбрать удобный график - офис/гибрид
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС и льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.