Команда RuBackup разрабатывает клиент-серверную систему резервного копирования с 2018 года. С 2020 мы входим в Группу Астра. Мы можем выполнять резервное копирование всего, что может встретиться в linux мире и планируем портировать наш продукт на иные платформы. Наши пользователи — сотрудники крупных корпораций страны, которые используют виртуализацию и переходят на российское ПО.
Ты наш человек, если:
- Видишь закономерности там, где другие видят просто цифры.
- Любишь разбирать системы на винтики, чтобы понять, как они работают и как их улучшить. Исследовать новые системы — разбираться, как они генерируют данные, и находить точки роста.
- Не просто применяешь ML-алгоритмы, а осознанно выбираешь какой подойдет под задачу. Строишь ML-модели не ради ML, а чтобы они реально решали задачи бизнеса.
- Отлично знаешь SQL и имеешь опыт построения витрин данных.
- Пишешь на Python так, чтобы код был не только рабочим, но и понятным для коллег.
- Можешь оптимизировать процессы, предсказывать поломки, автоматизировать рутину.
- Умеешь работать с большими данными, но без фанатизма — нам важнее скорость и качество проведенного анализа.
Задачи:
- Подготовка витрин данных.
- Внедрение инструментов машинного обучения.
- Консолидация данных.
- Проектирование, разработка и совершенствование моделей машинного обучения для различных сценариев, включая: классификацию резервных данных, диалоговый ИИ (conversational AI).
- Внедрение масштабируемых и воспроизводимых ML-пайплайнов.
- Интеграция моделей в продакшен-сервисы с обеспечением надежного мониторинга, логирования и автоматизированных практик CI/CD (MLOps) для непрерывного улучшения и быстрых итераций.
- Совместная работа с инженерами данных по определению архитектур данных и управляемых сервисов, способствующих эффективному обучению и инференсу моделей.
- Постоянная оптимизация ML-моделей через:
1. отбор и инженерию признаков,
2. снижение размерности,
3. бенчмаркинг для повышения точности, скорости и масштабируемости.
- Внедрение проверок качества моделей, обнаружения смещений (bias detection) и фреймворков объяснимости моделей (model explainability).
- Тесное взаимодействие с продакт-менеджерами, UX-дизайнерами и внутренними стейкхолдерами для понимания бизнес-требований и их перевода в технические ML-решения.
Что мы ожидаем от вас:
- Степень бакалавра или магистра в Computer Science, Data Engineering, Data Science, Machine Learning или смежной области.
- Опыт разработки и внедрения ML-моделей в продакшен с использованием Python и популярных ML-фреймворков (TensorFlow, PyTorch, scikit-learn).
- Понимание принципов MLOps, знакомство с best practices управления данными, CI/CD-пайплайнов.
- Опыт работы с anomaly detection, анализом временных рядов и/или NLP.
- Сильные статистические знания, включая:
1. проверку гипотез,
2. регрессионный анализ,
3. метрики оценки моделей.
- Способность декомпозировать сложные задачи на четко определенные компоненты, выявлять и прорабатывать неопределенности.
- Самостоятельность, внимательность к деталям и готовность работать в динамичной команде.
- Исследовательский mindset.
Будет плюсом:
- Опыт работы с BI-системами.
Условия:
- Работа в аккредитованной ИТ-компании.
- Уверенность в будущем. Работаем по ТК РФ: у нас стабильный и прозрачный "белый" доход.
- Забота о здоровье. Оформим полис ДМС со стоматологией.
- Удаленка или гибрид на твой выбор.