Москва, 1-я улица Ямского Поля, 1к1
Метро: БелорусскаяМы создаём платформу, которая позволяет бизнесам самостоятельно настраивать и обучать AI-агентов для автоматизации клиентской поддержки. Наши агенты взаимодействуют с пользователями, обрабатывают знания, интегрируются в CRM/Helpdesk и помогают компаниям масштабировать поддержку, не теряя качества.
Сейчас мы ищем инженера, который поможет вывести платформу на новый уровень — с мультиагентной архитектурой, локальными моделями и голосовыми интерфейсами.
Что предстоит делать:
Проектировать и реализовывать мультиагентную архитектуру: распределение ролей между агентами, координация, состояние, память, workflow.
Разрабатывать инструменты (tools) на Python, которые агенты будут использовать для выполнения задач: API-вызовы, бизнес-логика, базы данных.
Интегрировать облачные LLM и развёртывать локальные модели: Llama, Mistral, Qwen и др.; оптимизировать inference, квантизацию, стоимость.
Реализовывать голосовые интерфейсы: STT/TTS, аудио-взаимодействие, логика голосового диалога.
Создавать платформенные возможности для клиентов: настройка агентов без кода, подключение источников знаний, сценариев, интеграций.
Собирать и анализировать метрики работы агентов: точность, полезность, время ответа, пользовательские KPIs; строить мониторинг, дашборды, A/B-тесты.
Писать чистый, поддерживаемый код; разворачивать микросервисы, API, очереди, фоновые задачи.
Требования:
Хорошее знание Python.
Опыт работы с LangGraph, LangChain или аналогичными фреймворками агентов.
Понимание LLM, prompt-engineering, RAG, векторных хранилищ (Weaviate, Pinecone и др.).
Опыт асинхронного программирования, API, вебхуков (FastAPI, aiohttp).
Навыки встраивания локальных моделей: inference, оптимизация, развёртывание.
Опыт создания и использования метрик, мониторинга и аналитики.
Активно использовать и интегрировать современные AI-инструменты для разработки (Cursor, AI Studio etc).
Уверенные навыки работы с Git-workflow, код-ревью.
Желательно: опыт работы с голосовыми интерфейсами (TTS/STT).
Будет плюсом:
Опыт дообучения локальных моделей (fine-tuning, LoRA/QLoRA).
Работа с vLLM, Ollama, Exllama.
Понимание метрик поддержки клиентов: SLA, CSAT, FCR.
Опыт создания low-code/no-code сред.
Опыт разработки систем наблюдаемости (Prometheus, Grafana, OpenTelemetry).
Знание Node.js и понимание архитектуры веб-приложений (frontend/back-end, REST/GraphQL, серверная логика).
Мы предлагаем:
Проект на пересечении AI, мультиагентных систем и платформенной инженерии.
Возможность влиять на архитектуру и продукт в ключевой области.
Офис в Москве (м. Белорусская) с комфортными условиями.
Работа с cutting-edge технологиями: локальные и облачные LLM, голосовые агенты, масштабируемые системы.
Дружелюбная команда, быстрые итерации, эксперименты.
Москва
до 360000 RUR
Москва
до 320000 RUR
Москва
до 320000 RUR