Москва
Метро: Библиотека им.Ленина
Команда Production IT растет и развивается.
Мы в поисках новых направлений и никогда не стоим на месте, поэтому нам в команду необходим вдумчивый и ответственный профессионал.
Обязанности:
Реализация и поддержка RAG-пайплайна для AI-ассистента
Подготовка и структурирование .md документации для индексации
Подбор и тестирование LLM (Qwen, Llama, Solar, Saiga и др.) под разные бизнес-кейсы
Оптимизация по:
потреблению памяти
скорости инференса
качеству решения узкоспециализированных задач
Prompt engineering, переформулирование запросов
Построение дашбордов в Grafana
Работа с InfluxDB
Метрики качества и производительности моделей
Работа с LangGraph (state + nodes)
Логирование и трейсинг через LangSmith
Реализация ML API на FastAPI
Structured output от LLM
Работа с Redis Streams
Разворачивание моделей (CPU / GPU, vLLM)
Контейнеризация через Docker-compose
Обучение модели детекции layout документов (0.85 mAP)
Обучение и тестирование NER
Обучение моделей детекции текста на MMOCR
Работа с ResNet18, YOLOv7
Рефакторинг и переработка API (Django, 3 сервиса)
Оценка качества изображений: шум, размытие, перспектива
Обучение кастомной модели классификации шрифтов и стилей текста
Ожидаем от кандидата
Практический опыт построения RAG-архитектур
Опыт работы с LLM в production
Понимание принципов инференса (GPU/CPU, vLLM)
Уверенный Python (FastAPI / Django)
Опыт обучения CV/NLP моделей
Понимание метрик качества (mAP, F1, precision/recall)
Опыт контейнеризации (Docker)
Опыт построения ML-сервисов с логированием и мониторингом
Будет плюсом:
Опыт работы с банковскими или финтех-проектами
Опыт оптимизации инференса под ограниченные ресурсы
Опыт работы с пайплайнами переобучения
Городской информационный центр Инфосити
Москва
до 250000 RUR
Москва
от 230000 RUR