1. LLM-инженерия и обработка естественного языка
Опыт решения задач:
построение многоступенчатых LLM-воркфлоу;
классификация запросов, маршрутизация, определение интента;
генерация структурированных ответов под строгими правилами;
построение guardrails, проверок политик и комплайнса;
работа с prompt-архитектурами, системными ролями, инструкционными пайплайнами.
Знание LLM-API:
OpenAI / Claude / Llama-локальные модели;
умение работать с токен-лимитами, rate limits, логированием.
2. Retrieval-Augmented Generation (RAG)
Нужен уверенный опыт в создании RAG-систем:
построение ETL-цепочек: загрузка → парсинг → нормализация → нарезка → эмбеддинги;
работа с PDF/HTML/docx-документами, включая сложные структуры;
генерация эмбеддингов (OpenAI, local, bge, Instructor и т.п.);
построение поискового слоя: dense vectors, hybrid search, reranking;
опыт оптимизации качества поиска: chunking strategy, context windows, indexing policies.
Хранилища:
Qdrant / Elastic / Weaviate / Pinecone (любой векторный движок);
Postgres + S3-подобные стораджи.
3. API-интеграции и работа с внешними источниками данных
Опыт интеграции крупного внешнего контента:
загрузка больших массивов документов из API;
соблюдение разных типов лицензий и правил доступа;
кэширование, версионирование, периодическая репликация данных;
парсинг сложных страниц и документов;
работа с XML/JSON API (Entrez, REST, SOAP, custom endpoints).
4. Backend-разработка
Нужен уверенный инженерный подход:
Python (FastAPI или аналогичный фреймворк);
построение модульной архитектуры с отдельным Core API;
асинхронные пайплайны и очереди (Celery, Redis streams, asyncio);
авторизация/аутентификация, логирование, rate-limiting.
5. Автоматизация процессов и интеграционные оркестраторы
Опыт работы хотя бы с одним низко-кодовым/оркестрационным инструментом:
n8n / Airflow / Make / Zapier self-hosted / Node-RED;
создание кастомных нод или HTTP-коннекторов;
обработка писем через IMAP/SMTP;
вызовы к REST API сторонних систем;
построение цепочек автоматизаций с учётом SLA, ошибок, ретраев.
6. Работа с базами данных и инфраструктурой
уверенный SQL (Postgres);
нормализация схем, индексы, миграции;
Docker, docker-compose;
базовый DevOps: деплой, логирование, мониторинг.
Плюсом будет:
опыт self-hosted развёртывания сервисов (n8n, Qdrant, внутренние APIs);
понимание distributed systems и масштабирования воркфлоу.
7. Опыт работы в среде Cursor (или аналогичных AI-IDE)
умение вести разработку в AI-ориентированной среде: структурирование задач, работа с ветками, управление изменениями через AI-ассистентов;
опыт построения длинных технических цепочек (ETL, RAG, интеграции) внутри Cursor с корректным разбиением на файлы и модули;
понимание, как использовать Cursor для ускорения разработки: рефакторинг, автогенерация кода, создание тестов, поддержка документации;
способность выстраивать чистую архитектуру, чтобы AI-IDE не “ломала” проект и не вносила ошибки.
8. Безопасность и комплайнс
Необходимо понимать базовые принципы:
ограничения на вывод моделей (guardrails, policy enforcement);
фильтрация опасных запросов;
режимы ограниченного доступа к данным;
строгий учёт источников в выводе;
запрет на персональные данные и защита пользовательских входов.
В идеале еще:
1. Архитектура и системный дизайн
разработка архитектуры AI-модулей, RAG-поиска, ETL-конвейеров и backend-сервисов;
проектирование структур данных, индексов, хранилищ и API-слоёв;
выбор и обоснование технического стека, библиотек, моделей, инфраструктурных решений;
постановка технических стандартов, схемы версионирования контента и принципов комплайнса.
2. Проектирование компонентной схемы и ключевых модулей
декомпозиция проектов на подсистемы: Core API, оркестратор LLM, индексы, интеграции, Telegram-фронт;
проектирование потоков данных: загрузка → обработка → индексация → inference;
создание архитектуры автоматизации процессов (CMS ↔ n8n ↔ внешние сервисы);
определение SLA, точек отказа, механизмов ретрая и мониторинга.
3. Полный цикл разработки и реализация
разработка backend-логики (Python/FastAPI), ETL-пайплайнов, модулей RAG и векторных индексов;
реализация Telegram-бота как фронтенда: меню, состояния, онбординг, ограничения доступа;
интеграция с API внешних источников, почтовых серверов, CMS, n8n-воркфлоу;
создание минимальных фронтенд-панелей для внутренних инструментов и админки.
4. Инфраструктура, развёртывание и поддержка
подготовка Docker-окружения, self-hosted сервисов (n8n, векторные БД, API-сервисы);
настройка логирования, мониторинга и стабильной работы пайплайнов;
регулярное обновление индексов, обработка ошибок, оптимизация скорости и качества поиска;
контроль соответствия проектных решений требованиям безопасности и лицензирования.
5. Контроль качества, валидация и улучшение моделей
внедрение guardrails, проверок политик и корректной маршрутизации запросов;
отладка и оптимизация RAG (chunking, embeddings, ranking, prompt-flows);
тестирование модулей, аудит данных, корректность цитирования и ссылок;
инициирование улучшений архитектуры и постоянная оптимизация всей системы.
системное мышление в архитектуре AI-проектов;
умение работать с большим количеством документов и форматов;
аккуратность в данных и соблюдение лицензионных ограничений;
гибкость между высокоуровневым ML и практическим backend-кодом;
готовность писать чистый, предсказуемый, читаемый Python.
удаленка (без совмещений)
з/п в рынке, бонусы и премии
мы - трудоголики и достигаторы (ищем таких же)
тестовое задание - разработка прототипа