Москва, Авиамоторная улица, 10к2
Метро: АвиамоторнаяРазработка и поддержка ML-пайплайнов и сервисов на Python/FastAPI
Оптимизация инференса LLM (vLLM, квантизация, батчинг)
Проектирование и развитие RAG-систем и агентов (Plan/ReAct, MCP)
Работа с векторными, реляционными и NoSQL базами данных
Интеграция с оркестраторами и системами очередей (Airflow, Kafka, Celery)
Участие в проектировании системной архитектуры
Python — уверенное владение, ООП, чистый читаемый код
FastAPI — разработка REST-сервисов
Базы данных: PostgreSQL, MongoDB, Redis, Qdrant (векторные)
Docker / Docker Compose — контейнеризация и деплой
NLP / LLM — понимание принципов работы языковых моделей
RAG — опыт построения retrieval-augmented систем
LLM-инференс — vLLM и аналоги
Агентные паттерны — Tools, Human in the Loop, Plan/ReAct, MCP
Метрики ML — понимание способов оценки качества моделей
Будет плюсом:
Kubernetes — базовое понимание или опыт работы
Kafka / Celery — опыт с очередями сообщений
Linux — уверенная работа в командной строке
Observability — мониторинг и логирование ML-сервисов
Airflow — оркестрация ETL/ML-задач