Мы — команда разработки инструментов машинного обучения в Центре Практического Искусственного Интеллекта Сбербанка.
Наша цель — сделать лучшие решения для автоматизации работы со структурированными данными: от automl фреймворков до AI-агентов, использующих SotA практики и инструменты.
Флагманские библиотеки:
• LightAutoML
• RePlay
• PyBoost
Обязанности
Мы ищем ML-инженера, который сможет глубоко погрузиться в предметную область и принять активное участие в разработке мультиагентных систем для работы со структурированными данными (таблички, временные ряды и не только) — от идеи до внедрения в бизнес-процессы крупнейшей финтех-компании, а также в создании и развитии лучших open-source инструментов.
- разрабатывать PoC и MVP AI-агентов на базе LLM с использованием фреймворков (LangChain, GigaChain); участвовать в их интеграции в сервисы банка
- проектировать и реализовывать мульти-агентную систему, способную на автоматизированную разработку моделей на структурированных данных: от feature engineering до валидации, мониторинга и продакшна
- разработка и улучшение среды для исполнения сгенерированного кода, в которой можно безопасно исполнять код для ETL и ML-пайплайнов с помощью AI-агентов: разработка execution environment и sandbox-механизмов
- участвовать в полном ML-цикле: от исследования и создания прототипов до продакшн-внедрения и мониторинга моделей
- адаптировать LLM (Gigachat и open-source модели) под внутренние и внешние задачи с применением Prompt Tuning, RAG и PEFT-методов
- анализировать и адаптировать существующие SOTA-решения; сопровождать внедрение и публикация результатов на конференциях уровня A*/Q1
- взаимодействовать с прикладными и бизнес-командами внутри экосистемы Сбера.
Требования
- опыт работы на позиции ML Engineer, Data Scientist или похожей (уровень Middle–Senior)
- уверенное владение Python; опыт работы с PyTorch, transformers, numpy, pandas и scikit-learn
- опыт контейнеризации и оркестрации (Docker, Kubernetes/OpenShift) и CI/CD-систем
- глубокое понимание deep learning, классических ML-алгоритмов, архитектуры нейросетей и необходимых математических основ (линейная алгебра, теория вероятностей)
- практический опыт работы с LLM, RAG и фреймворками наподобие LangChain
- навыки работы с SQL/NoSQL-хранилищами (PostgreSQL, ClickHouse, Elastic, FAISS, Qdrant и другие векторные базы)
- умение разбираться в научных публикациях и современных SOTA-решениях, формулировать и продвигать собственные исследовательские гипотезы. Публикации в A*/Q1 конференциях или участие в соревнованиях (Kaggle) — приветствуются.
Условия
- комфортный современный офис рядом с метро Кутузовская
- возможность выбрать удобный график – офис/гибрид
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.