Middle+ Data Scientist (MLOps Expert)

Описание вакансии

Мы строим высоконагруженные production-grade ML-системы для обеспечения банковской безопасности. Наш фокус: антифрод, управление рисками, обнаружение аномалий и оптимизация бизнес-процессов. Внедряем различные решения – от классического ML до state-of-the-art архитектур в DL.

Ищем опытного DS, который умеет не только обучать модели, но и отвечать за их жизненный цикл в проде.

Обязанности

Cоздание моделей:

- Разработка алгоритмов. Работа как с классикой (LightGBM/CatBoost), так и современным стеком (LLM-агенты, RAG-системы)

Раскатка моделей в прод:

- Упаковка моделей в Docker

- Настройка CI/CD пайплайнов

- Версионирование данных, моделей и артефактов в MLflow

- Деплой в Kubernetes

Настройка процессов:

- Проектирование end-to-end пайплайнов (от сырых логов до сервиса)

- Cборка данных из SQL/NoSQL баз

- Проектирование витрин признаков (Feature Engineering)

- Автоматизация переобучения моделей в Airflow

- Работа с потоковыми данными в Kafka

Мониторинг:

- Настройка мониторинга data drift и model decay

- Логирование экспериментов (MLflow)

- Анализ данных и валидация моделей

Ифраструктура и интеграция:

- Совместная работа DevOps/Backend по интеграции моделей в микросервисную архитектуру

Требования

DS-бэкграунд:

- Опыт работы DS/DE от 3-х лет (с подтверждённым опытом вывода моделей в прод)

- Понимание математики классического ML и архитектуры нейросетей (PyTorch/TF)

- Мультидоменная экспертиза: минимум в 2 доменах (CV, NLP/LLM, TS, RL, RS, Audio).

Инженерная база:

- Уверенный Python (чистый код, знание numpy/pandas/scikit-learn)

- Понимание микросервисной архитектуры и работы с очередями (Kafka)

MLOps-инструментарий:

- Опыт работы с Airflow (оркестрация), MLflow (трекинг), Docker/K8s (контейнеризация)

- Опыт использования систем контроля версий Git/Bitbucket

Data & Infra:

- Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data стеком (Spark, Hadoop)

- Умение решить любую несложную инфраструктурную задачу, с которой не работал(а) ранее

Будет плюсом:

- Опыт с LLMs (fine-tuning, RAG, evaluation via RAGAS/DeepEval, vLLM).

- Глубокая экспертиза в узком домене из списка

- Опыт работы с Kafka/Spark

- Уверенный опыт с LangChain, LangGraph, function calling

- Законченный ШАД / OZON Masters / AI Masters

Условия

Инновационные, амбициозные проекты и задачи, которые развивают: всегда есть возможность прокачать свои навыки в работе и профессионально расти;
Среда для обмена знаниями – высокая экспертиза внутри команды;
Сплоченная команда, работающая над общими задачами и умеющая хорошо отдыхать;
Нашу культуру создают сами сотрудники – мы их слышим и помогаем создавать и поддерживать корпоративные комьюнити по интересам
Стабильная заработная плата и годовой бонус;
Полностью офисный формат работы. Современный IT-офис вблизи Москва-Сити в пяти минутах от метро "Кутузовская", с фитнес залом;
Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития;
Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа;
Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ;
Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров;
Вознаграждение за рекомендацию друзей в команду Сбера.