Разработчик платформы GenAI (Senior Backend Engineer)

Первый Бит

Разработчик платформы GenAI (Senior Backend Engineer)

Описание вакансии

О проекте

Создаем веб-платформу, где пользователи могут создавать, настраивать и запускать свои решения на базе GenAI. Тебя ждут участие в проектировании серверной архитектуры и реализация ключевых сервисов: от API и очередей до интеграций с LLM и векторными БД.

Твои задачи

Бэкенд и архитектура:

Участие в выборе технологического стека и проектировании масштабируемой серверной архитектуры (сервисы, слои, границы контекстов)

Проектирование и реализация основных API (REST/gRPC), real-time (WebSocket/SSE)

Проработка модели данных и схемы хранения (Mongo, PostgreSQL), очередей/стримов.

Закладывать безопасность: аутентификация и авторизация (OAuth2/OIDC, JWT), RBAC/ABAC, rate limiting, audit

GenAI-функциональность:

Интеграции с провайдерами LLM (OpenAI/Anthropic/Yandex/Sber): чат, функции-вызовы, стриминг токенов

RAG-пайплайн: загрузка и нарезка документов, эмбеддинги, векторный поиск (Qdrant), перегруппировка результатов

Оркестрация промпов, бюджетирование, логирование и наблюдаемость качества ответов

Качество и надежность:

Покрытие кода тестами (unit/integration)

Оптимизация производительности

Поддержка наблюдаемости

Требования

4+ лет коммерческой разработки на Python, 2+ года с FastAPI и asyncio.

Уверенное владение Pydantic, SQLAlchemy.

Опыт проектирования и реализация серверных API (REST/gRPC), real-time (WebSocket/SSE).

Отличное знание SQL/реляционных БД (PostgreSQL) и NoSQL (Mongo, Redis).

Опыт работы с очередями/стримами и асинхронной обработкой задач.

Практика интеграции внешних API.

Тестирование (unit/integration), базовые навыки нагрузочного тестирования.

Docker, базовые навыки Kubernetes; настройка CI/CD.

Понимание принципов безопасности, устойчивости и наблюдаемости в проде.

Будет плюсом

Опыт построения RAG-систем, знание LangChain/LlamaIndex или аналогов.

Работа с векторными БД (qdrant, pgvector, Pinecone) и эмбеддинг-моделями.

Опыт со streaming inference (vLLM, ollama), очередями задач (Celery/Temporal)

Посмотреть контакты работодателя

Похожие вакансии

Первый Бит

Backend Engineer

Первый Бит

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Лаборатория Касперского

Python Developer (DWH)

Лаборатория Касперского

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Савина Марина Витальевна

Middle Python Developer(Full Stack)/ Разработчик AI-бота

Савина Марина Витальевна

Удаленная работа
  • Москва

  • до 150000 RUR

Рекомендуем
Kidsout
Удаленная работа
  • Москва

  • до 400000 RUR

Backend-разработчик (Python/FastAPI + Telegram Bot)

Корицкая Софья Игоревна

Удаленная работа
  • Москва

  • до 220000 RUR

Crazy Panda
Удаленная работа
  • Москва

  • до 220000 RUR

Красное & Белое, розничная сеть

Программист .Net

Красное & Белое, розничная сеть

Удаленная работа
  • Москва

  • до 220000 RUR

МОЛЛ
Удаленная работа
  • Москва

  • от 100000 RUR

Удаленная работа
  • Москва

  • от 100000 RUR

Першина Маргарита Юрьевна

Junior Android Platform Engineer (Custom OS for AI device)

Першина Маргарита Юрьевна

Удаленная работа
  • Москва

  • до 120000 RUR

Полный день
  • Москва

  • до 250000 RUR

Удаленная работа
  • Москва

  • до 4000 USD

Атлон ФМ
Полный день
  • Москва

  • до 4000 USD

Михалевский Александр Владимирович

Старший тренер по фитнесу

Михалевский Александр Владимирович

Удаленная работа
  • Москва

  • от 250000 RUR

Першина Маргарита Юрьевна

Junior Android-разработчик (Java)

Першина Маргарита Юрьевна

Удаленная работа
  • Москва

  • до 100000 RUR

Лаборатория Касперского
Полный день
  • Москва

  • до 100000 RUR

Инженер-сметчик

Централ Парк Тауэр

Гибкий график
  • Москва

  • до 100000 RUR

101 Интернет
Удаленная работа
  • Москва

  • до 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию