3+ лет в разработке (Python или Node.js/TypeScript)
опыт создания production‑чат‑ботов в Telegram или WhatsApp Business/Cloud API
уверенное знание OpenAI API и принципов prompt‑/cost‑engineering
понимание STT/TTS‑стека (Vapi, Twilio, ElevenLabs, Google Speech эко‑система и др.)
практика интеграции REST/gRPC‑API, Webhook, очереди (Redis, RabbitMQ, SQS)
базовые DevOps‑навыки: Docker, CI/CD, мониторинг (Grafana/Prometheus)
английский не ниже B1 — читать доки, переписку с вендорами
Будет плюсом:
опыт RAG или hybrid‑search
оптимизация затрат LLM на миллионах запросов
понимание специфики HoReCa: бронирования, CRM, "вечерние" пиковые нагрузки
знакомство с GDPR, PCI DSS или аналогичными стандартами
Что предстоит делать
Снижать стоимость LLM‑стека
анализировать затраты, внедрять кэширование, тестировать разные LLM
экспериментировать с fine‑tuning / distillation
Прокачивать UX и стабильность чат‑бота
улучшать структуру промптов, NLU‑пайплайн и логику диалогов
расширять сценарии в Telegram & WhatsApp (бот‑меню, платёжки, rich‑media)
Развивать голосовой канал (Vapi)
настраивать синтез/ASR, отлаживать звонки, писать обработчики ошибок
улучшать реалистичность и скорость ответа
Следить за метриками
строить дешборды latency / LLM‑cost / voice‑QoS
A/B‑тестировать изменения и демонстрировать экономию
Поддерживать инфраструктуру
Passionate Agency
Москва
от 2000 USD
ИИ Технологии
Москва
до 200000 RUR
Москва
до 200000 RUR
Москва
от 150000 RUR
Москва
до 350000 RUR