Мы защищаем будущее: создаем систему кибербезопасности для генеративного ИИ в Сбере. Наш продукт SOC4AI (Security Operations Center for AI) - это компонент в структуре SOC (Security Operations Center) Сбербанка, отвечающий за мониторинг, анализ и противодействие киберугрозам на GenAI - модели и AI - агенты. Мы находимся на передовой защиты цифрового завтра и ищем талантливых разработчиков, готовых решать задачи высочайшей сложности.
Вам предстоит:
- разработка, обучение и оптимизация ML - моделей для обнаружения аномалий и киберугроз в поведении GenAI - моделей и AI - агентов
- проектирование и реализация пайплайнов подготовки и обработки данных (Feature Engineering, предобработка, векторизация) для задач машинного обучения
- интеграция ML - моделей в высоконагруженные сервисы продукта SOC4AI
- участие в построении и поддержке Real - time пайплайнов потоковой обработки данных для оперативного выявления киберугроз
- взаимодействие со смежными командами (платформы кибербезопасности, backend - разработчики, аналитики) для согласования требований к данным и интеграции моделей
- написание высококачественного, эффективного, тестируемого и документированного кода
- участие на всех этапах жизненного цикла ML - моделей - от сбора данных и экспериментов до мониторинга дрейфа и переобучения в продуктивной среде
- проведение демонстраций реализованного функционала стейкхолдерам и командам
- анализ и участие в разрешении инцидентов, связанных с работой ML - компонентов системы
- работа в Agile - команде, участие в планировании спринтов и оценке задач.
Что для нас важно:
- опыт коммерческой разработки и внедрения ML - решений от 3-х лет
- уверенное владение Python и основными библиотеками для машинного обучения (scikit-learn, pandas, NumPy, PyTorch / TensorFlow, LLM)
- опыт разработки и оптимизации моделей для задач NLP и/или анализа последовательностей
- опыт работы с LLM, Transformers
- опыт работы с Apache Flink (включая Apache Flink SQL) для обработки потоковых данных
- опыт работы со стеком Big Data: Apache Spark (для пакетной обработки) и/или Hadoop HDFS (для распределенного хранения)
- опыт работы с реляционными/нереляционными базами данных (PostgreSQL, NoSQL)
- опыт работы с векторными базами данных (PostgreSQL, Qdrant, Milvius, ChromaDB)
- понимание принципов MLOps: CI/CD для моделей, экспериментов, версионирования данных и моделей (Data Version Control, MLflow), контейнеризация (Docker) и оркестрация (Kubernetes)
- опыт работы в команде по гибким методологиям разработки (Agile/Scrum/Kanban).
Будет серьезным преимуществом:
- опыт работы в проектах с микросервисной архитектурой, ориентированной на обработку больших объемов данных в режиме реального времени (Real-time)
- опыт работы с системами трейсинга (OpenTelemetry, Jaeger) и мониторинга (Prometheus, Grafana)
- любознательность в области генеративного ИИ: понимание базовых принципов работы LLM, инженерии промптов (PromptEng), знакомство с фреймворками для создания AI-агентов.
Мы предлагаем:
- комфортный современный офис рядом с м. Ленинский проспект
- офисный формат работы
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- программа адаптации и помощь руководителя на старте
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.