Теги: genai, prompt engineering, llm api, rag, Python, SQL, Data Engineering, AI-агент
О нашей команде:Команда занимается развитием и поддержкой корпоративного хранилища данных в Лаборатории Касперского. Cоздает ядро современной Customer Data Platform (CDP) — системы, предназначенной для сбора, унификации и обработки near real time больших объемов клиентских данных из различных источников данных (брокеры сообщений, реляционные БД, REST API).
Сейчас мы расширяем сферу деятельности команды: помимо инженерии, мы начинаем активно внедрять AI. Мы ищем того, кто поможет нам грамотно выстроить процессы интеграции с LLM-платформой и внедрения AI-решений во внутренние сервисы компании.
Вам предстоит: - Full-cycle Development: Участие в полном цикле создания AI-продуктов — от генерации гипотез и быстрого прототипирования до промышленной эксплуатации и последующего мониторинга.
- Data Pipeline Engineering: Разработка end-to-end пайплайнов данных для AI-функций: организация сбора, нормализации, хранения, индексации и поиска информации.
- Интеграция в экосистему: Встраивание моделей и ML-сервисов в существующую ИТ-инфраструктуру, обеспечение бесшовной интеграции с продуктами, сервисами и внутренними источниками данных.
- Технологический стек: Определение оптимального стека технологий для разработки и эксплуатации (выбор библиотек, платформ, инструментов для обучения, тестирования и развертывания).
- Quality: Обеспечение высокого качества решений: контроль производительности, масштабируемости, надежности и безопасности систем.
- Оценка качества RAG/Агентов: Разработка и внедрение подходов к оценке RAG-систем и AI-агентов (точность, фактологичность, скорость ответа, стоимость инференса, автоматизированное и ручное тестирование, проверка гипотез и итеративное улучшение моделей и пайплайнов на основе данных).
Мы ожидаем от Вас:
- Практический опыт разработки и вывода в production LLM-based решений (агенты, RAG, fine-tuning);
- Знание LLM-фреймворков (langchain, langgraph или аналоги) и подходов к разработке AI-агентов (function calling, structured output, context engineering);
- Хорошие навыки prompt/context engineering, опыт тестирования и регресспроверок промптов, понимание подходов к оценке llm-систем (offline-метрики, human evaluation, llm-as-a-judge, A/B тестирование);
- Знание ключевых ML-алгоритмов и библиотек (pytorch, scikit-learn, hugging face, etc), опыт их применения в продукте; Опыт разработки на Python (знание FastAPI или Litestar фреймворков);
- Хорошее знание SQL и опыт работы с реляционными СУБД (PostgresSQL/MS SQL Server);
- Опыт работы с векторными базами данных (Milvus/Qdrant/FAISS/pgvector) для RAGрешений;
- Опыт работы с большими объемами данных и оптимизации производительности;
- Опыт работы с Airflow и ETL-инструментами.
Будет плюсом:
- Опыт разработки стриминговых пайплайнов;
- Опыт работы с Kafka;
- Опыт работы с Hadoop стеком (Spark, Hive);
- Опыт работы с Docker, Kubernetes;
- Опыт работы с Prometheus, Grafana.
Что мы предлагаем:
- Сложные и интересные задачи, связанные с высокой нагрузкой и масштабированием; Возможность выстроить процессы с нуля;
- Расширение профессиональных компетенций в области AI;
- Современный стек технологий и рабочую среду, ориентированную на профессиональный рост;
- Развитие и карьерные перспективы в динамичной компании;
- Баланс между работой и личной жизнью.