Описание проекта:
Разработка демонстрационного прототипа мультиагентного персонализированного ассистента с диалоговым (текст/голос) интерфейсом для автоматизации комплексных рутинных задач на промышленном предприятии. Прототип разрабатывается для демонстрации возможностей технологии руководству и дальнейшего масштабирования в контуре предприятия.
Обязанности:
- Интеграция и настройка систем Speech-to-Text (STT) и Text-to-Speech (TTS)
(включая существующее решение на ElevenLabs, а также тестовые
стриминговые решения, которые находятся в разработке); - Реализация функциональности загрузки и обработки файлов различных
форматов (текст, таблицы, изображения, презентации, аудио/видео); - Разработка и поддержка механизма взаимодействия между агентами, а также
агента с человеком (Human-in-the-Loop); - Интеграция платформы n8n для части сложных флоу (которые полностью
закрываются инструментами платформы); - Встраивание и настройка системы логирования.
Требования: - Опыт backend-разработки на Python;
- Понимание принципов модульной архитектуры;
- Опыт работы с агентными и мультиагентными системами (крайне желательно);
- Опыт интеграции LLM (обучение/инференс, prompt engineering) Опыт работы с STT/TTS системами (Whisper, ElevenLabs и аналоги);
- Умение реализовывать системы логирования для ML-систем;
- Навыки работы с протоколом МСР или способность быстро в нем разобраться Опыт работы с n n (крайне желательно) или способность быстро освоить.
Условия: -
Удаленный формат работы;
-
Работу в команде увлеченных и профессиональных людей;
-
Решение сложных и интересных задач;
-
График работы: 5/2 (09-18:00 или 10:00-19:00);
-
Полностью белую ЗП (отталкиваемся от ваших ожиданий);
-
Работу в аккредитованной ИТ-компании.