1. LLM-инженерия и обработка естественного языка
Опыт решения задач:
построение многоступенчатых LLM-воркфлоу;
классификация запросов, маршрутизация, определение интента;
генерация структурированных ответов под строгими правилами;
построение guardrails, проверок политик и комплайнса;
работа с prompt-архитектурами, системными ролями, инструкционными пайплайнами.
Знание LLM-API:
OpenAI / Claude / Llama-локальные модели;
умение работать с токен-лимитами, rate limits, логированием.
2. Retrieval-Augmented Generation (RAG)
Нужен уверенный опыт в создании RAG-систем:
построение ETL-цепочек: загрузка → парсинг → нормализация → нарезка → эмбеддинги;
работа с PDF/HTML/docx-документами, включая сложные структуры;
генерация эмбеддингов (OpenAI, local, bge, Instructor и т.п.);
построение поискового слоя: dense vectors, hybrid search, reranking;
опыт оптимизации качества поиска: chunking strategy, context windows, indexing policies.
Хранилища:
Qdrant / Elastic / Weaviate / Pinecone (любой векторный движок);
Postgres + S3-подобные стораджи.
3. API-интеграции и работа с внешними источниками данных
Опыт интеграции крупного внешнего контента:
загрузка больших массивов документов из API;
соблюдение разных типов лицензий и правил доступа;
кэширование, версионирование, периодическая репликация данных;
парсинг сложных страниц и документов;
работа с XML/JSON API (Entrez, REST, SOAP, custom endpoints).
4. Backend-разработка
Нужен уверенный инженерный подход:
Python (FastAPI или аналогичный фреймворк);
построение модульной архитектуры с отдельным Core API;
асинхронные пайплайны и очереди (Celery, Redis streams, asyncio);
авторизация/аутентификация, логирование, rate-limiting.
5. Автоматизация процессов и интеграционные оркестраторы
Опыт работы хотя бы с одним низко-кодовым/оркестрационным инструментом:
n8n / Airflow / Make / Zapier self-hosted / Node-RED;
создание кастомных нод или HTTP-коннекторов;
обработка писем через IMAP/SMTP;
вызовы к REST API сторонних систем;
построение цепочек автоматизаций с учётом SLA, ошибок, ретраев.
6. Работа с базами данных и инфраструктурой
уверенный SQL (Postgres);
нормализация схем, индексы, миграции;
Docker, docker-compose;
базовый DevOps: деплой, логирование, мониторинг.
Плюсом будет:
опыт self-hosted развёртывания сервисов (n8n, Qdrant, внутренние APIs);
понимание distributed systems и масштабирования воркфлоу.
7. Опыт работы в среде Cursor (или аналогичных AI-IDE)
умение вести разработку в AI-ориентированной среде: структурирование задач, работа с ветками, управление изменениями через AI-ассистентов;
опыт построения длинных технических цепочек (ETL, RAG, интеграции) внутри Cursor с корректным разбиением на файлы и модули;
понимание, как использовать Cursor для ускорения разработки: рефакторинг, автогенерация кода, создание тестов, поддержка документации;
способность выстраивать чистую архитектуру, чтобы AI-IDE не “ломала” проект и не вносила ошибки.
8. Безопасность и комплайнс
Необходимо понимать базовые принципы:
ограничения на вывод моделей (guardrails, policy enforcement);
фильтрация опасных запросов;
режимы ограниченного доступа к данным;
строгий учёт источников в выводе;
запрет на персональные данные и защита пользовательских входов.
В идеале еще:
1. Архитектура и системный дизайн
разработка архитектуры AI-модулей, RAG-поиска, ETL-конвейеров и backend-сервисов;
проектирование структур данных, индексов, хранилищ и API-слоёв;
выбор и обоснование технического стека, библиотек, моделей, инфраструктурных решений;
постановка технических стандартов, схемы версионирования контента и принципов комплайнса.
2. Проектирование компонентной схемы и ключевых модулей
декомпозиция проектов на подсистемы: Core API, оркестратор LLM, индексы, интеграции, Telegram-фронт;
проектирование потоков данных: загрузка → обработка → индексация → inference;
создание архитектуры автоматизации процессов (CMS ↔ n8n ↔ внешние сервисы);
определение SLA, точек отказа, механизмов ретрая и мониторинга.
3. Полный цикл разработки и реализация
разработка backend-логики (Python/FastAPI), ETL-пайплайнов, модулей RAG и векторных индексов;
реализация Telegram-бота как фронтенда: меню, состояния, онбординг, ограничения доступа;
интеграция с API внешних источников, почтовых серверов, CMS, n8n-воркфлоу;
создание минимальных фронтенд-панелей для внутренних инструментов и админки.
4. Инфраструктура, развёртывание и поддержка
подготовка Docker-окружения, self-hosted сервисов (n8n, векторные БД, API-сервисы);
настройка логирования, мониторинга и стабильной работы пайплайнов;
регулярное обновление индексов, обработка ошибок, оптимизация скорости и качества поиска;
контроль соответствия проектных решений требованиям безопасности и лицензирования.
5. Контроль качества, валидация и улучшение моделей
внедрение guardrails, проверок политик и корректной маршрутизации запросов;
отладка и оптимизация RAG (chunking, embeddings, ranking, prompt-flows);
тестирование модулей, аудит данных, корректность цитирования и ссылок;
инициирование улучшений архитектуры и постоянная оптимизация всей системы.
системное мышление в архитектуре AI-проектов;
умение работать с большим количеством документов и форматов;
аккуратность в данных и соблюдение лицензионных ограничений;
гибкость между высокоуровневым ML и практическим backend-кодом;
готовность писать чистый, предсказуемый, читаемый Python.
удаленка (без совмещений)
з/п в рынке, бонусы и премии
мы - трудоголики и достигаторы (ищем таких же)
тестовое задание
АО «ОТП Банк» (JSC «OTP Bank»)
Москва
Не указана
Камешкова Екатерина Александровна
Москва
Не указана
ФАЙНДИЗАЙНГРУПП
Москва
от 200000 RUR
Москва
от 200000 RUR
Савельев Георгий Анатольевич
Москва
до 350000 RUR
Москва
до 360000 RUR