Эта вакансия в команду по работе с большими данными, где вместе с коллегами ты будешь:
- Развивать чат-бота на базе RAG. Предстоит интеграция его с сервисами компании и развитие агентной логики.
- Участвовать в проектах по классификации текстов: обращения клиентов, отзывы о компании, категории товаров.
- Участвовать в проектах по CV: распознавание документов, счетов, накладных. Поиск объектов на фото.
Команда состоит из 8 ML, менеджера проектов, Python-разработчиков и руководителя
Что мы ждем от тебя:
- Практический опыт работы с LLM в продакшене. Умение оборачивать LLM в прикладную логику с использованием LangChain/LangGraph или других фреймворков. Запуск и эксплуатация моделей через vLLM/SGLang/прочие инференс фреймворки
- Разработка RAG-систем: embeddings, chunking, retrieval, диагностика качества
- Работа с базами данных (PostgreSQL/MySQL, ClickHouse), работа с векторными БД (Qdrant / Milvus или аналоги)
- Разработка сервисов на Python + FastAPI (async, streaming, параллельность)
- Понимание reasoning-паттернов и агентных подходов (ReAct, tool calling, MCP)
- Опыт проектирования чат-ботов или агентных систем под продуктовые сценарии
Будет плюсом:
- Опыт или понимание дообучения моделей (LoRA / PEFT)
- Продвинутые агентные архитектуры (multi-agent, planner/executor)
- Продвинутые RAG архитектуры (GraphRAG, Agentic RAG)
- Оптимизация latency / throughput
- Минимизация галлюцинаций и борьба с промт-инъекциями
- Участие в архитектурном дизайне end to end LLM решений
Мы предлагаем:
- Участие в создании продуктов и сервисов, которые делают удобнее жизнь 23 млн клиентов в 40 странах мира
- Полную удаленку или гибрид в одном из 3 IT-офисов на выбор
- Прозрачную систему оценки и развития навыков
- Заботу о благополучии: ДМС со стоматологией после 3 месяцев работы, оплату доступа к платформе «Понимаю»
- Возможность обмена опытом в профессиональном сообществе ML-специалистов, поддержка при подготовке докладов на конференции и технических статей, внутренние курсы техноспикеров и техноавторов