Техлид по ИИ-агентам / Lead Agent Engineer (Python/LLM/RAG)

Техноинтеллект

Техлид по ИИ-агентам / Lead Agent Engineer (Python/LLM/RAG)

Москва, Средний Тишинский переулок, 28

Метро: Белорусская

Описание вакансии

Ищем лидера, который строил ИИ-агентов и возьмёт на себя процесс реализации ИИ агентов как своими силами, так и с привлечением команды: агенты + RAG + MCP + интеграции, качество/стоимость, безопасность и наблюдаемость.

Используем low-code/но-код подходы для оркестрации.

Архитектура (фокус роли)

  • E2E-дизайн платформы: графы агентов, маршрутизация моделей, хранение состояния, масштабирование, отказоустойчивость.

  • Проектирование MCP: набор инструментов/политик доступа, границы ответственности, версионирование и повторное использование.

  • API-контракты и версии (агенты, коннекторы), жизненный цикл промтов/агентов (PromptOps), канареечные выпуски и откаты.

  • Observability и SLO: метрики/логи/трейсы, алерты, бюджет latency/стоимости, capacity planning.

  • Безопасность и приватность: доступы (RBAC/ABAC), маскирование PII, аудит операций.

  • Governance знаний: источники, таксономии, свежесть и версионирование базы знаний.

Чем предстоит заниматься

  • Разработка ИИ-агентов: проектирование графов/инструментов, управление диалоговым состоянием, строгие структурированные ответы.

  • RAG-слой: пайплайн знаний (парсинг → чанкинг → эмбеддинги → векторный поиск), настройка top-k и базового reranking.

  • MCP: разработка MCP-серверов/инструментов для безопасного доступа агентов к данным и действиям.

  • Интеграции с CRM с помощью MCP.

  • Качество, стоимость и SLO: метрики (точность/faithfulness, latency p50/p95, стоимость запроса), кэш/дедуп и роутинг по сложности.

  • Гардрейлы: защита от prompt-injection, allow-list инструментов, лимиты контекста, политика «не знаю» + эскалация, валидация JSON перед записью в CRM.

  • Инфра-минимум: контейнеризация (Docker), простая CI/CD, централизованное логирование и метрики.

  • Построение и развитие команды. Прямое участие в формирование команды, управление командой

Требования

  • Опыт построения ИИ-агентов — от 2 лет (любой стек; опыт на low-/no-code платформах желателен).

  • 5+ лет серверной разработки на Python (желательно FastAPI/asyncio), уверенный SQL.

  • Практика LLM/RAG: эмбеддинги, retrieval, настройка контекста, few/zero-shot, работа со строгими схемами ответов.

  • Опыт проектирования MCP-инструментов/серверов или аналогичных плагин-/tool-серверов для агентов.

  • Понимание observability (логи/трейсы/метрики), умение держать SLO и бюджет стоимости.

  • Базовая безопасность данных: доступы, приватность, аудит.

Будет плюсом

  • Развёртывание LLM локально (CPU/GPU, контейнеры), настройка инференса и маршрутизации моделей.

  • Опыт с Langflow или аналогичными low-code оркестраторами.

  • Rerank/NER/классификация для разгрузки LLM.

  • Менторинг небольшой команды.

Формат и стек

Удалённо/гибрид — обсуждаемо.

Стек: Python, FastAPI/asyncio, SQL, Docker, CI/CD; LLM/RAG, embeddings, JSON-Schema; MCP; мониторинг (метрики/логи/трейсы).

Навыки
  • LLM
  • RAG
  • AI
  • Orchestration Agent
  • MCP
  • Python
  • FastAPI
  • Embeddings
  • JSON-Schema
  • Prompt-Injection Defense
  • Caching/Dedup
  • Observability
  • SLO
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Техноинтеллект

Data Science Lead / ML & AI Architect

Техноинтеллект

Полный день
  • Москва

  • Не указана

Рекомендуем
Русский Экспресс

AI Team Lead

Русский Экспресс

Полный день
  • Москва

  • Не указана

Рекомендуем
JT marketing
Удаленная работа
  • Москва

  • от 5000 USD

Рекомендуем
METASCAN
Удаленная работа
  • Москва

  • от 400000 RUR

Эйчар Рокет

LLM инженер

Эйчар Рокет

Удаленная работа
  • Москва

  • от 400000 RUR

EvaTeam
Удаленная работа
  • Москва

  • от 400000 RUR

ТЛ Групп
Удаленная работа
  • Москва

  • до 350000 RUR

Senior Rust Developer

Зенит-Брокер

Удаленная работа
  • Москва

  • от 5000 USD

СБЕР
Удаленная работа
  • Москва

  • от 5000 USD

АльфаСтрахование

Главный Data Engineer

АльфаСтрахование

Удаленная работа
  • Москва

  • от 5000 USD

Рунити
Удаленная работа
  • Москва

  • от 5000 USD

Marfatech
Удаленная работа
  • Москва

  • от 5000 USD

Aston

AI Engineer

Aston

Удаленная работа
  • Москва

  • от 5000 USD

Бриф
Удаленная работа
  • Москва

  • до 520000 RUR

Sputnik8
Удаленная работа
  • Москва

  • до 520000 RUR

Python разработчик LLM

Свистунова Екатерина Александровна

Полный день
  • Москва

  • до 420000 RUR

Aston

AI Engineer

Aston

Удаленная работа
  • Москва

  • до 420000 RUR

Rabbit Group

AI Tech Lead

Rabbit Group

Удаленная работа
  • Москва

  • до 420000 RUR

Sapiens solutions

Python Developer Lead

Sapiens solutions

Удаленная работа
  • Москва

  • до 420000 RUR

Ai engineer (инженер ИИ)

Аммосов Олег Игоревич

Удаленная работа
  • Москва

  • до 420000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию