Senior AI Engineer

Москва, Ленинградское шоссе, 39Ас1

Метро: Водный стадион

Описание вакансии

Теги: genai, prompt engineering, llm api, rag, Python, SQL, Data Engineering, AI-агент

О нашей команде:
Команда занимается развитием и поддержкой корпоративного хранилища данных в Лаборатории Касперского. Cоздает ядро современной Customer Data Platform (CDP) — системы, предназначенной для сбора, унификации и обработки near real time больших объемов клиентских данных из различных источников данных (брокеры сообщений, реляционные БД, REST API).

Сейчас мы расширяем сферу деятельности команды: помимо инженерии, мы начинаем активно внедрять AI. Мы ищем того, кто поможет нам грамотно выстроить процессы интеграции с LLM-платформой и внедрения AI-решений во внутренние сервисы компании.
Вам предстоит:

Full-cycle Development: Участие в полном цикле создания AI-продуктов — от генерации гипотез и быстрого прототипирования до промышленной эксплуатации и последующего мониторинга.
Data Pipeline Engineering: Разработка end-to-end пайплайнов данных для AI-функций: организация сбора, нормализации, хранения, индексации и поиска информации.
Интеграция в экосистему: Встраивание моделей и ML-сервисов в существующую ИТ-инфраструктуру, обеспечение бесшовной интеграции с продуктами, сервисами и внутренними источниками данных.
Технологический стек: Определение оптимального стека технологий для разработки и эксплуатации (выбор библиотек, платформ, инструментов для обучения, тестирования и развертывания).
Quality: Обеспечение высокого качества решений: контроль производительности, масштабируемости, надежности и безопасности систем.
Оценка качества RAG/Агентов: Разработка и внедрение подходов к оценке RAG-систем и AI-агентов (точность, фактологичность, скорость ответа, стоимость инференса, автоматизированное и ручное тестирование, проверка гипотез и итеративное улучшение моделей и пайплайнов на основе данных).

Мы ожидаем от Вас:

Практический опыт разработки и вывода в production LLM-based решений (агенты, RAG, fine-tuning);
Знание LLM-фреймворков (langchain, langgraph или аналоги) и подходов к разработке AI-агентов (function calling, structured output, context engineering);
Хорошие навыки prompt/context engineering, опыт тестирования и регресспроверок промптов, понимание подходов к оценке llm-систем (offline-метрики, human evaluation, llm-as-a-judge, A/B тестирование);
Знание ключевых ML-алгоритмов и библиотек (pytorch, scikit-learn, hugging face, etc), опыт их применения в продукте; Опыт разработки на Python (знание FastAPI или Litestar фреймворков);
Хорошее знание SQL и опыт работы с реляционными СУБД (PostgresSQL/MS SQL Server);
Опыт работы с векторными базами данных (Milvus/Qdrant/FAISS/pgvector) для RAGрешений;
Опыт работы с большими объемами данных и оптимизации производительности;
Опыт работы с Airflow и ETL-инструментами.

Будет плюсом:

Опыт разработки стриминговых пайплайнов;
Опыт работы с Kafka;
Опыт работы с Hadoop стеком (Spark, Hive);
Опыт работы с Docker, Kubernetes;
Опыт работы с Prometheus, Grafana.

Что мы предлагаем:

Сложные и интересные задачи, связанные с высокой нагрузкой и масштабированием; Возможность выстроить процессы с нуля;
Расширение профессиональных компетенций в области AI;
Современный стек технологий и рабочую среду, ориентированную на профессиональный рост;
Развитие и карьерные перспективы в динамичной компании;
Баланс между работой и личной жизнью.