Senior AI / ML ENGINEER (RAG, LLM-оркестрация, интеграции)

Фарма-Перископ

Senior AI / ML ENGINEER (RAG, LLM-оркестрация, интеграции)

Описание вакансии

Фарма-Перископ — это продуктовая AI-/data-компания, которая создаёт платформы для анализа коммуникаций фармкомпаний с врачами и автоматизации контент-процессов. Мы работаем с крупными международными и российскими производителями, развиваем собственные модули конкурентной аналитики, мониторинга, прогнозирования и AI-инструменты вокруг больших массивов медицинского и маркетингового контента. Команда небольшая, гибкая, инженерная, с быстрыми циклами разработки, высоким уровнем автономии и фокусом на реальную пользу: прозрачные данные, автоматизация рутины и умные сервисы для рынка здравоохранения. 5 лет на рынке. Растем.

Требования к опыту и стеку

1. LLM-инженерия и обработка естественного языка

Опыт решения задач:

  • построение многоступенчатых LLM-воркфлоу;

  • классификация запросов, маршрутизация, определение интента;

  • генерация структурированных ответов под строгими правилами;

  • построение guardrails, проверок политик и комплайнса;

  • работа с prompt-архитектурами, системными ролями, инструкционными пайплайнами.

Знание LLM-API:

  • OpenAI / Claude / Llama-локальные модели;

  • умение работать с токен-лимитами, rate limits, логированием.

2. Retrieval-Augmented Generation (RAG)

Нужен уверенный опыт в создании RAG-систем:

  • построение ETL-цепочек: загрузка → парсинг → нормализация → нарезка → эмбеддинги;

  • работа с PDF/HTML/docx-документами, включая сложные структуры;

  • генерация эмбеддингов (OpenAI, local, bge, Instructor и т.п.);

  • построение поискового слоя: dense vectors, hybrid search, reranking;

  • опыт оптимизации качества поиска: chunking strategy, context windows, indexing policies.

Хранилища:

  • Qdrant / Elastic / Weaviate / Pinecone (любой векторный движок);

  • Postgres + S3-подобные стораджи.

3. API-интеграции и работа с внешними источниками данных

Опыт интеграции крупного внешнего контента:

  • загрузка больших массивов документов из API;

  • соблюдение разных типов лицензий и правил доступа;

  • кэширование, версионирование, периодическая репликация данных;

  • парсинг сложных страниц и документов;

  • работа с XML/JSON API (Entrez, REST, SOAP, custom endpoints).

4. Backend-разработка

Нужен уверенный инженерный подход:

  • Python (FastAPI или аналогичный фреймворк);

  • построение модульной архитектуры с отдельным Core API;

  • асинхронные пайплайны и очереди (Celery, Redis streams, asyncio);

  • авторизация/аутентификация, логирование, rate-limiting.

5. Автоматизация процессов и интеграционные оркестраторы

Опыт работы хотя бы с одним низко-кодовым/оркестрационным инструментом:

  • n8n / Airflow / Make / Zapier self-hosted / Node-RED;

  • создание кастомных нод или HTTP-коннекторов;

  • обработка писем через IMAP/SMTP;

  • вызовы к REST API сторонних систем;

  • построение цепочек автоматизаций с учётом SLA, ошибок, ретраев.

6. Работа с базами данных и инфраструктурой

  • уверенный SQL (Postgres);

  • нормализация схем, индексы, миграции;

  • Docker, docker-compose;

  • базовый DevOps: деплой, логирование, мониторинг.

Плюсом будет:

  • опыт self-hosted развёртывания сервисов (n8n, Qdrant, внутренние APIs);

  • понимание distributed systems и масштабирования воркфлоу.

7. Опыт работы в среде Cursor (или аналогичных AI-IDE)

  • умение вести разработку в AI-ориентированной среде: структурирование задач, работа с ветками, управление изменениями через AI-ассистентов;

  • опыт построения длинных технических цепочек (ETL, RAG, интеграции) внутри Cursor с корректным разбиением на файлы и модули;

  • понимание, как использовать Cursor для ускорения разработки: рефакторинг, автогенерация кода, создание тестов, поддержка документации;

  • способность выстраивать чистую архитектуру, чтобы AI-IDE не “ломала” проект и не вносила ошибки.

8. Безопасность и комплайнс

Необходимо понимать базовые принципы:

  • ограничения на вывод моделей (guardrails, policy enforcement);

  • фильтрация опасных запросов;

  • режимы ограниченного доступа к данным;

  • строгий учёт источников в выводе;

  • запрет на персональные данные и защита пользовательских входов.

В идеале еще:

  • Опыт разработки Telegram-ботов
  • Базовые frontend-компетенции


Обязанности

1. Архитектура и системный дизайн

  • разработка архитектуры AI-модулей, RAG-поиска, ETL-конвейеров и backend-сервисов;

  • проектирование структур данных, индексов, хранилищ и API-слоёв;

  • выбор и обоснование технического стека, библиотек, моделей, инфраструктурных решений;

  • постановка технических стандартов, схемы версионирования контента и принципов комплайнса.

2. Проектирование компонентной схемы и ключевых модулей

  • декомпозиция проектов на подсистемы: Core API, оркестратор LLM, индексы, интеграции, Telegram-фронт;

  • проектирование потоков данных: загрузка → обработка → индексация → inference;

  • создание архитектуры автоматизации процессов (CMS ↔ n8n ↔ внешние сервисы);

  • определение SLA, точек отказа, механизмов ретрая и мониторинга.

3. Полный цикл разработки и реализация

  • разработка backend-логики (Python/FastAPI), ETL-пайплайнов, модулей RAG и векторных индексов;

  • реализация Telegram-бота как фронтенда: меню, состояния, онбординг, ограничения доступа;

  • интеграция с API внешних источников, почтовых серверов, CMS, n8n-воркфлоу;

  • создание минимальных фронтенд-панелей для внутренних инструментов и админки.

4. Инфраструктура, развёртывание и поддержка

  • подготовка Docker-окружения, self-hosted сервисов (n8n, векторные БД, API-сервисы);

  • настройка логирования, мониторинга и стабильной работы пайплайнов;

  • регулярное обновление индексов, обработка ошибок, оптимизация скорости и качества поиска;

  • контроль соответствия проектных решений требованиям безопасности и лицензирования.

5. Контроль качества, валидация и улучшение моделей

  • внедрение guardrails, проверок политик и корректной маршрутизации запросов;

  • отладка и оптимизация RAG (chunking, embeddings, ranking, prompt-flows);

  • тестирование модулей, аудит данных, корректность цитирования и ссылок;

  • инициирование улучшений архитектуры и постоянная оптимизация всей системы.

Что важно в подходе

  • системное мышление в архитектуре AI-проектов;

  • умение работать с большим количеством документов и форматов;

  • аккуратность в данных и соблюдение лицензионных ограничений;

  • гибкость между высокоуровневым ML и практическим backend-кодом;

  • готовность писать чистый, предсказуемый, читаемый Python.

Условия

  • удаленка (без совмещений)

  • з/п в рынке, бонусы и премии

  • мы - трудоголики и достигаторы (ищем таких же)

  • тестовое задание - разработка прототипа

Навыки
  • SQL
  • Python
Посмотреть контакты работодателя

Похожие вакансии

ГК Орбита

ML Engineer Techlead/Team Lead

ГК Орбита

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
evrone.ru
Удаленная работа
  • Москва

  • до 360000 RUR

Рекомендуем
Медиа Ком

ML Techlead/Team Lead

Медиа Ком

Удаленная работа
  • Москва

  • до 360000 RUR

Рекомендуем
ICVR
Удаленная работа
  • Москва

  • до 360000 RUR

Live Typing
Удаленная работа
  • Москва

  • до 310000 RUR

1001 LABS
Удаленная работа
  • Москва

  • до 310000 RUR

Any
Удаленная работа
  • Москва

  • до 310000 RUR

РТЛабс
Удаленная работа
  • Москва

  • до 310000 RUR

KTS
Удаленная работа
  • Москва

  • до 310000 RUR

METASCAN

Tech lead Python

METASCAN

Удаленная работа
  • Москва

  • до 310000 RUR

Spice IT
Удаленная работа
  • Москва

  • до 310000 RUR

Островок
Удаленная работа
  • Москва

  • до 310000 RUR

Revoluterra

Data Engineer

Revoluterra

Удаленная работа
  • Москва

  • до 400000 RUR

МТС
Удаленная работа
  • Москва

  • до 400000 RUR

HeadHunter
Удаленная работа
  • Москва

  • до 400000 RUR

Медиа Ком

ML-engineer

Медиа Ком

Удаленная работа
  • Москва

  • до 400000 RUR

Циан
Удаленная работа
  • Москва

  • до 400000 RUR

Удаленная работа
  • Москва

  • от 2000 USD

RedLab
Удаленная работа
  • Москва

  • от 2000 USD

BINAGroup

ML-инженер

BINAGroup

Удаленная работа
  • Москва

  • до 500000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию