Мы строим высоконагруженные production-grade ML-системы для обеспечения банковской безопасности. Наш фокус: антифрод, управление рисками, обнаружение аномалий и оптимизация бизнес-процессов. Внедряем различные решения – от классического ML до state-of-the-art архитектур в DL.
Ищем опытного DS, который умеет не только обучать модели, но и отвечать за их жизненный цикл в проде.
Cоздание моделей:
- Разработка алгоритмов. Работа как с классикой (LightGBM/CatBoost), так и современным стеком (LLM-агенты, RAG-системы)
Раскатка моделей в прод:
- Упаковка моделей в Docker
- Настройка CI/CD пайплайнов
- Версионирование данных, моделей и артефактов в MLflow
- Деплой в Kubernetes
Настройка процессов:
- Проектирование end-to-end пайплайнов (от сырых логов до сервиса)
- Cборка данных из SQL/NoSQL баз
- Проектирование витрин признаков (Feature Engineering)
- Автоматизация переобучения моделей в Airflow
- Работа с потоковыми данными в Kafka
Мониторинг:
- Настройка мониторинга data drift и model decay
- Логирование экспериментов (MLflow)
- Анализ данных и валидация моделей
Ифраструктура и интеграция:
- Совместная работа DevOps/Backend по интеграции моделей в микросервисную архитектуру
DS-бэкграунд:
- Опыт работы DS/DE от 3-х лет (с подтверждённым опытом вывода моделей в прод)
- Понимание математики классического ML и архитектуры нейросетей (PyTorch/TF)
- Мультидоменная экспертиза: минимум в 2 доменах (CV, NLP/LLM, TS, RL, RS, Audio).
Инженерная база:
- Уверенный Python (чистый код, знание numpy/pandas/scikit-learn)
- Понимание микросервисной архитектуры и работы с очередями (Kafka)
MLOps-инструментарий:
- Опыт работы с Airflow (оркестрация), MLflow (трекинг), Docker/K8s (контейнеризация)
- Опыт использования систем контроля версий Git/Bitbucket
Data & Infra:
- Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data стеком (Spark, Hadoop)
- Умение решить любую несложную инфраструктурную задачу, с которой не работал(а) ранее
Будет плюсом:
- Опыт с LLMs (fine-tuning, RAG, evaluation via RAGAS/DeepEval, vLLM).
- Глубокая экспертиза в узком домене из списка
- Опыт работы с Kafka/Spark
- Уверенный опыт с LangChain, LangGraph, function calling
- Законченный ШАД / OZON Masters / AI Masters
Аналитический Центр Минприроды России
Москва
от 85000 RUR