Обязанности: - Знание принципов работы LLM (Large Language Models) и RAG-сервисов
- Понимание принципов работы с векторными базами данных
- Опыт работы с ML фреймворками: (llamaindex/langchain, langGraph, vllm)
- Автоматизация процессов развертывания обновления с использованием Ansible / Helm chart / Gitlab-CI
- Опыт работы с Kubernetes
- Опыт работы с брокерами сообщений (Kafka, RabbitMQ)
- Настройка систем мониторинга на базе стека Prometheus + Grafana
Будет плюсом: высшее образование ИТ/технич./естест.-научн./финанс./эконом. + прикладная математика/информатика
Стек:
Back: Python, FastAPI, Kubernetes, Kafka, Redis
БД: PostgreSQL, Opensearch/Elasticsearch
ML: llamaindex/langchain, langGraph, vllm
Требования: - Оптимизировать и масштабировать RAG-сервисы для эффективного поиска и генерации данных
- Оптимизировать и масштабировать мультиагентские системы
- Обеспечение высокой доступности и масштабируемости систем на основе LLM
- Проведение code-review, рефакторинг и оптимизация кода