Разработка и внедрение систем на основе Retrieval-Augmented Generation (RAG) для улучшения качества генерации текста.
Проектирование и реализация агентных систем, способных взаимодействовать с пользователями и выполнять сложные задачи. Исследование и внедрение новых технологий и подходов в агентных системах.
Работа в тесном сотрудничестве с командами разработчиков, аналитиков и других специалистов для интеграции NLP решений в продукты компании.
Создание внутренних бенчмарков для систем RAG и агентных систем.
Проведение тестирования и валидации моделей, а также анализ их производительности.
Дообучение open-source моделей для RAG и агентных систем.
Требования:
Опыт 2+ лет в NLP/ML;
Работа с RAG;
Понимание различных архитектур RAG, этапов retrieval и reranking;
Знание методов обучения каждого из этапов (langchain, llamaindex);
Fine-tuning LLM (PyTorch, transformers);
Построение агентных и мультиагентных систем (langchain/langgraph/langfuse, smol-agents, openai swarm);
Экспертиза в бэкенде для ML и облачных технологиях.
Будет плюсом:
Понимание DevOps процессов (выкатка на k8s, мониторинг, алертинг);
Опыт работы с Docker, виртуальными машинами, k8s;
Опыт Inference моделей (FastApi/KServe/TorchServe/Nvidia Triton/vLLM/SgLang);
Навыки инженера-новатора:
Опыт в ML System Design;
Умение принимать решения в условиях неопределенности (стартап-среда).