Москва, улица Клары Цеткин, 2
Метро: БалтийскаяЧем Вы будете заниматься:
исследовать и внедрять самые актуальные технологии GenAI: от многоагентных систем и продвинутых RAG-архитектур до задач распознавания и синтеза речи (STT/TTS);
быстро валидировать гипотезы — от идеи до работающего пилота за минимальное время. Ты не будешь писать много кода, но соберешь и настроиProof-of-Concept, который докажет ценность идеи;
демонстрировать результаты — эффектно презентовать рабочие прототипы командам и стейкхолдерам, чтобы увлечь их и подготовить решение к передаче на масштабирование;
работать на переднем крае инфраструктуры: запускать и кастомизировать мощные open-source LLM, строить и оптимизировать векторные базы данных в защищенном контуре предприятия;
экспериментировать и улучшать — постоянно тестировать новые подходы к работе с данными, интеграции с внешними API и архитектуры для умных агентов;
делиться экспертизой — быть внутренним экспертом новых технологий, растить знания внутри команды и помогать внедрять их в ключевые продукты компании.
Мы ожидаем, что Вы:
умеете работать с большими языковыми моделями (LLM) и строить/оптимизировать RAG-системы с нуля;
пишете эффективный код на Python — нашем основном языке для быстрого прототипирования и пилотирования;
имеете опыт работы с реляционными БД (например, PostgreSQL) и интеграции сервисов через современные протоколы (REST, GraphQL, OAuth2);
можете упаковывать решения в Docker-контейнеры для обеспечения их переносимости и воспроизводимости;
используете фреймворки вроде LangChain, LlamaIndex или Haystack для ускорения разработки LLM-приложений;
умеете разворачивать и дорабатывать веб-сервисы на FastAPI;
умеете интегрировать и настраивать векторные базы данных (pgvector, Qdrant, Milvus, ChromaDB) для работы со смысловым поиском;
имеете практический опыт работы с Model Context Protocol (MCP) или аналогичными стандартами для подключения инструменов.
Будет плюсом:
проектирование и реализация агентных и мультиагентных систем, способных к сложному поведению;
понимание основ DevOps-практик (Kubernetes, CI/CD) и MLOps-подходов для надежного вывода моделей в продакшн;
участие в полноценных исследовательских проектах (R&D) — от постановки гипотезы до ее жизнеспособности.
Мы предлагаем:
Москва
от 200000 RUR
Лаборатория системных технологий
Москва
до 200000 RUR