Описание проекта:
Разработка демонстрационного прототипа мультиагентного персонализированного ассистента с диалоговым (текст/голос) интерфейсом для автоматизации комплексных рутинных задач на промышленном предприятии. Прототип разрабатывается для демонстрации возможностей технологии руководству и дальнейшего масштабирования в контуре предприятия.
Обязанности:
- Разработка и оптимизация backend-инфраструктуры для работы LLM и RAGсистемы;
- Проектирование, реализация и обслуживание векторных баз знаний (настройка, обновление, масштабирование), в том числе – для персонализации ассистента;
- Реализация и тонкая настройка компонентов RAG: чанкинг текста, скоринг релевантности чанков, реранкинг результатов, промпт-инжиниринг
- Базовая настройка MLOps/DevOps инфраструктуры проекта: контейнеризация (Docker), оркестрация (Kubernetes), CI/CD пайплайны;
- Разработка и интеграция backend-части админ-панели (управление базами знаний RAG, логирование диалогов);
- Взаимодействие с ML-разработчиком и внутренней командой заказчика
Требования: - Опыт разработки backend-приложений (Python, желательно Node.js);
- Понимание принципов модульной и микросервисной архитектуры;
- Опыт работы с PostgreSQL (или аналогичными реляционными/векторными СУБД)
- Практический опыт реализации RAG: техники чанкинга, скоринга,
реранкинга, оптимизации промптов для RAG
Опыт проектирования и разработки API с использованием REST, GraphQL;
интеграция через Webhook, OAuth 2; - Опыт работы с MLOps/Devops инструментами: Kubernetes, Docker, MLflow: понимание принципов CI/CD.
Условия: -
Удаленный формат работы;
-
Работу в команде увлеченных и профессиональных людей;
-
Решение сложных и интересных задач;
-
График работы: 5/2 (09-18:00 или 10:00-19:00);
-
Полностью белую ЗП (отталкиваемся от ваших ожиданий);
-
Работу в аккредитованной ИТ-компании.