Привет! Это команда ML платформы.
Мы отвечаем за стандартизацию процессов MLOps и ModelOps, разрабатываем и поддерживаем сервисы и пакеты для решения задач:
- запуск пайплайнов машинного обучения,
- трекинг экспериментов,
- хранение и версионирование моделей и датасетов,
- инференс и мониторинг моделей.
Наша команда занимается разработкой публичного Python агента (SDK) по работе с ML платформой для всех DS и адаптацией инструментов ML инфраструктуры под потребности отдельных команд, кастомными интеграциями и исследованиями.
Ищем инженера, который готов вместе с нами развивать платформенную инфраструктуру и поддерживать высокий уровень инженерной культуры в компании.
Наш стек:
- Основная часть backend сервисов реализована на go.
- Отлаженный командами SRE и RE Gitlab CI позволяющий проводить деплой сервисов и пакетов по кнопке.
- Python3.10 - 3.13, Poetry, Pydantic
- Kubernetes, Prometheus, Vault.
- PostgreSQL, Redis.
- Выделение ресурсов по кнопке - базы, redis-ы, s3 бакеты.
Примеры задач:
- Создание кастомных dataloader-ов и интеграций-хелперов с сторонними хранилищами (click, posgtres, vertica).
- Встроенные, коробочные интеграции в Python SDK с torch, torch-light.
- Добавление возможности логирования нескалярных метрик (например тензоров).
- Оптимизация текущей работы, неблокирующие запросы в бекенды сервисов при обучении моделей.
- Стандартизация работы с окружениями всех DS разработчиков и контроль за ними.
- Сбор телеметрии с клиента и контроль за утилизацией ресурсов.
Мы ожидаем:
- Опыт коммерческой разработки на Python, понимание тонкостей языка.
- Опыт работы с asyncio, multiprocessing и multithreading
- Умение писать чистый, тестируемый код.
- Опыт работы c Git.
- Желание построить качественную ML Платформу и развивать ее.
Будет плюсом:
- Опыт работы с ML и понимание mlops-практик.
- Владение ЯП Go.
- Опыт в проектировании и разработке публичных пользовательских Python-пакетов.
- Опыт разработки публичных CLI интерфейсов.