Backend-разработчик Python (AI / RAG-системы)

B2B-Center

Backend-разработчик Python (AI / RAG-системы)

Москва, набережная Тараса Шевченко, 23А

Описание вакансии

B2B-Center — ведущая ИТ-компания, которая занимается разработкой программного обеспечения для корпоративных закупок и продаж. Более 20-ти лет мы помогаем проводить закупки по всему миру.

Наша миссия — это развитие справедливой конкуренции и формирование единого рынка электронных торгов в России и за ее пределами. B2B-Center не только является безусловным лидером в своей области, но и уже много лет занимает лидирующие позиции в рейтингах среди российских IT-компаний.



Обязанности:

  • Создание, поддержка и оптимизация бэкенд-сервисов на FastAPI для системы интеллектуальных AI-ассистентов, включая написание чистого, поддерживаемого и хорошо тестируемого кода, участие в проектировании архитектуры системы.
  • Интеграция и управление источниками данных (PostgreSQL, Qdrant, Elasticsearch), разработка стратегий гибридного поиска, переранжирования и фильтрации контекста, интеграция с LLM API или локальными инференс-серверами, формирование эффективных промптов.
  • Организация асинхронной обработки задач с использованием Celery + RabbitMQ (инференс, обновление данных, переиндексация), реализация эффективного кэширования (Redis) запросов и ответов, проектирование и оптимизация схем баз данных и векторных коллекций под задачи RAG.
  • Настройка и поддержка CI/CD пайплайнов, мониторинг работы системы, качества RAG-извлечения и ответов ассистента, обеспечение отказоустойчивости системы, особенно критичных RAG-компонентов.

Требования:

  • Продвинутое знание Python 3.9+, глубокий опыт разработки RESTful API с использованием FastAPI (асинхронность, dependency injection, Pydantic, background tasks), уверенное владение SQLAlchemy (Core и/или ORM) для работы с реляционными данными.
  • Экспертные знания PostgreSQL (сложные запросы, оптимизация, индексы), опыт работы с векторными базами данных Qdrant (создание/настройка коллекций, управление векторизацией, эффективный поиск похожих векторов k-NN, работа с метаданными, payload фильтры), опыт работы с Elasticsearch (индексация текста/метаданных, полнотекстовый и гибридный поиск, агрегации, понимание роли Elasticsearch в RAG), уверенное использование Redis (кэширование включая инвалидацию, использование как брокера для Celery, структуры данных pub/sub, списки, хэши).
  • Опыт работы с RabbitMQ (протокол AMQP, декларация очередей/обменников, routing, надежная доставка сообщений), опыт использования Celery с RabbitMQ или Redis для управления асинхронными задачами (длительный инференс моделей, подготовка контекста для RAG, обновление векторных индексов).
  • Опыт работы с Docker (сборка образов, Docker Compose), понимание принципов CI/CD (GitHub Actions, GitLab CI), умение писать тесты (pytest).
  • Глубокое понимание архитектуры и компонентов RAG (Retrieval-Augmented Generation), опыт интеграции LLM (OpenAI API, Anthropic, open-source модели через Hugging Face Transformers/Text Generation Inference) в бэкенд через API, практический опыт реализации и оптимизации пайплайнов адаптивного RAG (динамический выбор источников/индексов, адаптивное извлечение контекста, гибридный поиск, ранжирование и фильтрация извлеченных чанков, формирование оптимального промпта для LLM), понимание эмбеддингов (embedding models), их генерации и хранения.
  • Личные качества:Сильное аналитическое мышление и способность проектировать сложные адаптивные системы, умение работать в кросс-функциональной команде (тесное взаимодействие с NLP-инженерами, Data Scientists, фронтенд-разработчиками, продукт-менеджерами), готовность быстро осваивать новые подходы в быстроразвивающейся сфере LLM и RAG, нацеленность на результат, умение документировать решения и процессы.

    Будет плюсом:
  • Опыт работы с фреймворками для локального запуска LLM (Llama.cpp, vLLM, Text Generation Inference), знакомство с библиотеками для NLP (NLTK, spaCy, Hugging Face transformers, sentence-transformers), понимание методов оценки качества RAG-систем (Relevancy, Faithfulness, Answer Correctness), базовые знания тонкой настройки LLM (Fine-tuning, LoRA, QLoRA).
  • Опыт работы с Kubernetes в production, опыт настройки мониторинга и логирования (Prometheus/Grafana, ELK/OpenSearch).
  • Опыт работы с системами кэширования LLM-ответов (Semantic Cache), знание фреймворков для ML-экспериментов (MLflow).
  • Опыт разработки production-ready чат-ботов или диалоговых систем, понимание архитектурных паттернов для диалоговых систем, наличие проектов с открытым исходным кодом, демонстрирующих работу с RAG, векторами, LLM, опыт оптимизации производительности и снижения задержек (latency) в RAG-пайплайнах.

    Мы предлагаем:
  • Отсутствие бюрократии и бессмысленных процессов;
  • Работа в IT-компании, аккредитованной в Министерстве цифрового развития;
  • Возможность расширять свой инструментарий и применять новые средства разработки и подходы в масштабе большой компании;
  • Достойная, полностью «белая» оплата труда;
  • Гибкий график работы;
  • Расширенный ДМС со стоматологией.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Лаборатория Касперского

Python Developer (DFI)

Лаборатория Касперского

Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
Робопро
Полный день
  • Москва

  • Не указана

Рекомендуем
AH Group IT
Полный день
  • Москва

  • от 2000 USD

Первый Бит

Python-разработчик

Первый Бит

Удаленная работа
  • Москва

  • от 2000 USD

CDNvideo (ООО СДН-видео)
Полный день
  • Москва

  • до 150000 RUR

Домклик

Python Developer MLOps

Домклик

Удаленная работа
  • Москва

  • до 150000 RUR

РБ
Полный день
  • Москва

  • до 150000 RUR

Доктор Веб
Полный день
  • Москва

  • до 150000 RUR

Ритейл-Процессинг

Python backend developer

Ритейл-Процессинг

Удаленная работа
  • Москва

  • до 300000 RUR

Telega.in
Удаленная работа
  • Москва

  • до 300000 RUR

Домклик
Полный день
  • Москва

  • до 300000 RUR

БАЗИС
Удаленная работа
  • Москва

  • до 300000 RUR

Домклик

Python Developer

Домклик

Удаленная работа
  • Москва

  • до 300000 RUR

Правительство Москвы

Python-Разработчик

Правительство Москвы

Полный день
  • Москва

  • до 300000 RUR

SkillStaff
Полный день
  • Москва

  • до 300000 RUR

idaproject
Удаленная работа
  • Москва

  • до 300000 RUR

Полный день
  • Москва

  • до 300000 RUR

СберМедИИ
Удаленная работа
  • Москва

  • до 300000 RUR

RoRe Group
Полный день
  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию