Big Data – один из ключевых юнитов МТС. Наши технологии применяются практически во всех направлениях компании - финансы, маркетинг, обслуживание, планирование сети, HR, розница.
MLOps Platform – платформа для организации и автоматизации процессов, связанных с разработкой, обучением, тестированием и развертыванием моделей машинного обучения, а также управлением их жизненным циклом.
Сейчас мы находимся в поиске Middle Devops Engineer в MLOps Platform.
Чем предстоит заниматься:
- Сопровождать и развивать инфраструктуру MLOps-платформы: заниматься поиском и оптимизацией узких мест, рассматривать инциденты, устранять аварии, консультировать пользователей;
- Проводить RnD с целью внедрения нового функционала, совершенствования MLOps-платформы;
- Разворачивать новые инструменты и сервисы MLOps-платформы;
- Поддерживать/участвовать в реализации практик DevSecOps (внедрение практик безопасности на всех этапах разработки и применения моделей машинного обучения);
- Проводить мониторинг использования ресурсов и планировать масштабирование инфраструктуры;
- Участвовать в процессах миграции инфраструктуры платформы, подключении новых ресурсов в kubernetes-кластер;
- Внедрять систему мониторинга производительности моделей и сервисов;
- Настраивать алертинг и логирование для быстрого выявления сбоев или деградации производительности.
Что мы от тебя ждем:
- Навыки администрирования Linux, Kubernetes, понимание и опыт работы с Docker и CI/CD инструментами, сетевое администрирование;
- Умение автоматизировать процессы развертывания и масштабирования;
- Анализ производительности инфраструктуры и внесение улучшений для оптимизации скорости работы платформы. Контроль за эффективным использованием ресурсов и затратами;
- Понимание концепции observability. Знакомство с инструментами мониторинга и централизованного логирования. Навыки построения дэшбордов и настройки алертов в Grafana;
- Умение диагностировать проблемы по логам и метрикам и принимать меры по стабилизации системы;
- Владение инструментами экосистемы MLOps: Jupyter Notebooks, VSCode, Kserve, ArgoCD, MLFlow, Airflow;
- Понимание предметной обрасти ML и MLOps. Понимание специфики задач и процессов Data Science;
- Практический опыт участия во внедрении и поддержке решений для автоматизации ML-процессов (CI/CD для моделей, деплоймент, мониторинг) приветствуется;
- Умение формулировать и доносить технические решения до коллег и пользователей платформы;
- Опыт взаимодействия с разработчиками ML/DS-направления.
Что мы предлагаем:
- Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
- Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;
- Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
- Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;
- Полезные курсы и вебинары в корпоративном университете и электронную библиотеку;
А еще:
- ДМС с первого месяца работы, включая стоматологию;
- Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях;
- Отпуск 28 календарных дней;
- Прием врачей общей практики и массаж в офисе;
- Мобильная связь за счет компании и льготные тарифы для близких;
- Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.