deeplay — продуктовая ИТ-компания. Мы создаём системы и решения в сфере интеллектуальных игр.
Мы ценим идейных людей, которых заряжают нестандартные задачи и профессиональные вызовы.Тех, кто любит экспериментировать, находить уникальные решения и всегда ориентируется на результат. Если тебе близок такой подход, будем рады видеть тебя среди наших тиммейтов!
Мы активно развиваем направление машинного обучения и искусственного интеллекта. За последние 3 года мы создали множество ML-решений, и сейчас пришло время систематизировать и автоматизировать нашу инфраструктуру. Ищем опытного MLOps-инженера, который возглавит это направление и построит современную ML-платформу.
С нами ты можешь комфортно работать из любого уголка мира, потому что мы:
Настроили процессы технического оснащения, чтобы можно было рассчитывать на нашу помощь в подготовке техники для работы, где бы ты ни находился.
Выстроили систему взаимодействия — никаких бесконечных чатов в ТГ. Работаем через онлайн-сервис управления проектами и корпоративный мессенджер с настроенной картой каналов.
Организовываем рабочие процессы с учётом часовых поясов, время для регулярных командных встреч подбирается максимально удобно для всех.
Помогаем сохранять контекст и знакомиться с коллегами из других отделов — регулярно проводим общие информационные и развлекательные онлайн-мероприятия, а также командные встречи с выездами в российские города и за границу.
Основные задачи:
Разработка MLOps-платформы для автоматизации ML-workflows: оркестрация, мониторинг, деплой, self-service интерфейсы
Внедрение системы управления экспериментами (MLFlow или аналоги) для версионирования и отслеживания моделей
Организация multi-tenancy архитектуры для изоляции проектов и управления ресурсами, разграничение доступов к коду и данным.
Модернизация legacy-инфраструктуры и устранение технического долга в существующих ML-решениях
Обеспечение масштабируемости: параллельное обучение, распределенные вычисления, оптимизация использования GPU.
Для их реализации тебе потребуется:
Опыт работы MLOps-инженером от 3+ лет
Глубокое знание Python и опыт работы с ML-фреймворками (TensorFlow, PyTorch)
Практический опыт с Kubernetes и понимание best practices для запуска ML-workloads
Практический опыт с облачными платформами
Опыт построения ML-пайплайнов (Argo, Airflow, Kubeflow, или аналоги)
Знание MLFlow или аналогичных платформ для MLOps
Опыт работы с различными типами БД (SQL/NoSQL) и понимание особенностей хранения ML-данных
Опыт настройки CI/CD для ML: автоматическое тестирование моделей, проверка качества, канареечные деплои.
Будет плюсом:
Опыт руководства командой или техническое лидерство
Знание Java на уровне чтения и отладки кода - большая часть наших сервисов написана на Java, способность разобраться в существующей кодовой базе значительно ускорит интеграцию ML-решений
Опыт работы с инструментами мониторинга (Prometheus, Grafana) и настройки алертинга для ML-систем
Опыт миграции legacy ML-инфраструктуры и модернизации технического долга
Знакомство с техниками оптимизации инференса (quantization, pruning, ONNX)
Опыт работы с Feature Store решениями или готовность их внедрить
Понимание принципов распределенного обучения и опыт оптимизации GPU-утилизации
Мы предлагаем:
Обучение и развитие:
Корпоративная жизнь:
P.S.: Хоть мы и постарались вместить в описание больше деталей, но нам все еще есть что рассказать. Будем рады познакомиться ;)