Data Engineer (RAG / AI Platform)

Т-Банк

Data Engineer (RAG / AI Platform)

Описание вакансии

Мы строим DataPlatfrom и AI-инфраструктуру, в которой инженеры, аналитики и разработчики смогут использовать современные подходы Retrieval-Augmented Generation (RAG) без боли и ручных костылей.
Наша цель — сделать RAG таким же привычным компонентом платформы, как SQL, Spark или CI/CD.
Для этого мы ищем Platform Data Engineer, который поможет сформировать и стандартизировать RAG-pipeline — от загрузки данных и чанкирования до метрик качества и retrival-механизмов. Дополнительным вызовом будет создание агентов для целей Data Platform используя RAG.

⚙️ Задачи:

  • Проектировать и внедрять RAG-пайплайны уровня платформы: ingestion данных, чанкирование, эмбеддинги, retrival, оценка качества ответов.
  • Исследовать SOTA-методы RAG (chunking, reranking, hybrid retrival, eval frameworks — RAGAS, TruLens, Langfuse, etc.) и адаптировать их под инфраструктуру Data / Dev Platform.
  • Создавать reusable компоненты (Python-библиотеки, API, Helm-чарты, шаблоны пайплайнов) для команд-потребителей.
  • Встраивать RAG в экосистему платформы: от self-service интерфейсов до observability и developer experience.
  • Разрабатывать метрики качества и мониторинг RAG-решений: faithfulness, groundedness, latency, coverage.
  • Агрегировать и распространять практики подготовки данных для использования в RAG.
  • Участвовать в воркшопах и кодлабах, обучать команды применению AI в продакшене.

🧩 Требования:

  • Уверенные знания Python, SQL.
  • Понимание архитектуры RAG-систем.
  • Опыт работы с LLM и embeddings — OpenAI, Gemini, Mistral.
  • Опыт работы с Docker, Git, Linux, Bash, знание CI/CD.
  • Понимание общих принципов устройства СУБД (реляционных + NoSQL).
  • Знание подходов по организации ETL-процессов, инструментов построения ETL.

🧩 Будет плюсом:

  • Практический опыт с векторными БД (Milvus, Qdrant, FAISS, Chroma).
  • Понимание ML evaluation и метрик RAG-решений.
  • Опыт с LangChain / LlamaIndex .
  • Опыт построения retrival-и-eval pipelines в проде.
  • Знание Trino / ClickHouse / Greenplum / Spark — как источников данных.
  • Понимание принципов System Design / архитектуры ML-платформ.
Навыки
  • Python
  • SQL
  • Docker
  • Linux
  • NoSQL
  • Работа с базами данных
  • ETL
  • Spark
  • Greenplum
Посмотреть контакты работодателя

Похожие вакансии

BORK
Полный день
  • Москва

  • Не указана

Рекомендуем
Леста Игры
Полный день
  • Москва

  • Не указана

Рекомендуем
IBS
Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР

Data Engineer

СБЕР

Полный день
  • Москва

  • Не указана

Яндекс
Полный день
  • Москва

  • Не указана

Инго Банк

Data Engineer

Инго Банк

Полный день
  • Москва

  • Не указана

Skillbox

Data Engineer

Skillbox

Удаленная работа
  • Москва

  • Не указана

Flowwow
Удаленная работа
  • Москва

  • от 270000 RUR

АО «ОТП Банк» (JSC «OTP Bank»)
Удаленная работа
  • Москва

  • от 270000 RUR

Мокка
Удаленная работа
  • Москва

  • от 270000 RUR

WILDBERRIES

Data engineer

WILDBERRIES

Удаленная работа
  • Москва

  • от 270000 RUR

SkillStaff
Полный день
  • Москва

  • от 270000 RUR

Тера Интегро

Data engineer (ETL)

Тера Интегро

Полный день
  • Москва

  • от 270000 RUR

Альфа-Банк

Data Scientist Middle/Middle+

Альфа-Банк

Полный день
  • Москва

  • от 270000 RUR

Платформа Больших Данных

Data Engineer / Дата-инженер

Платформа Больших Данных

Удаленная работа
  • Москва

  • до 211600 RUR

СБЕР
Полный день
  • Москва

  • до 211600 RUR

1001 LABS
Удаленная работа
  • Москва

  • до 211600 RUR

Оператор информационной системы

Инженер данных (Data Engineer)

Оператор информационной системы

Полный день
  • Москва

  • до 211600 RUR

АНО ЦИСМ

Data Engineer

АНО ЦИСМ

Полный день
  • Москва

  • до 211600 RUR

Дата Дженерейшн

Data Engineer

Дата Дженерейшн

Удаленная работа
  • Москва

  • до 340000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию