Проект крупной телеком компании! Команда проекта ведет разработку платформы для организации и автоматизации процессов, связанных с разработкой, обучением, тестированием и развертыванием моделей машинного обучения, а также управлением их жизненным циклом.
Твои задачи:
- Проводить RnD с целью внедрения нового функционала, совершенствования MLOps-платформы
- Разворачивать новые инструменты и сервисы MLOps-платформы
- Cопровождать и развивать инфраструктуру MLOps-платформы: заниматься поиском и оптимизацией узких мест, рассматривать инциденты, устранять аварии, давать консультации пользователям
- Поддерживать/участвовать в реализации практик DevSecOps (внедрение практик безопасности на всех этапах разработки и применения моделей машинного обучения)
- Проводить мониторинг использования ресурсов и планировать масштабирование инфраструктуры
- Участвовать в процессах миграции инфраструктуры платформы, подключении новых ресурсов в kubernetes-кластер
- Внедрять систему мониторинга производительности моделей и сервисов. Настраивать алертинг и логирование для быстрого выявления сбоев или деградации производительности
Основные требования:
- Опыт администрирования Linux, Kubernetes. Понимание и опыт работы с Docker и CI/CD инструментами. Сетевое администрирование
- Опыт автоматизировать процессы развертывания и масштабирования
- Опыт проводить анализ производительности инфраструктуры и внесение улучшений для оптимизации скорости работы платформы. Контроль за эффективным использованием ресурсов и затратами
- Понимание концепции observability. Знакомство с инструментами мониторинга и централизованного логирования. Навыки построения дэшбордов и настройки алертов в Grafana
- Умение диагностировать проблемы по логам и метрикам и принимать меры по стабилизации систем
- Умение донести техническое решение до пользователя
Что мы обеспечиваем:
- Официально оформление согласно ТК РФ с 1-го рабочего дня
- Работа в гибкой методологии разработки
- Возможность расширить свою экспертизу, используя современный стек технологий
- Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника
- Поездки на конференции и тренинги за счет компании, внутренние семинары, внутренние митапы, мы очень любим учиться новому
- Сообщества по интересам: Лига Спорта, Лига Интеллекта, Лига Шахмат, CyberЛига, ЛигаPerformance, Лига Добра, Лига Кошатников, а также возможность организовать свое сообщество и получить поддержку от компании
- Корпоративная культура со своими ценностями и традициями, в которой каждый человек чувствует себя частью команды
- Новая техника для комфортной работы