Ключевые задачи:
Проектирование и разработка infrastructure для LLM/RAG pipeline на базе IaC (Terraform, Pulumi, Ansible);
Автоматизация deployment процессов для моделей, inference engines и data pipelines;
Управление конфигурациями для различных окружений (dev, staging, production);
Обеспечение reproducibility и версионирования infrastructure;
Развертывание и управление LLM inference, vector databases, backend сервисов в Kubernetes;
Конфигурирование deployments, statefulsets, services для оптимальной работы компонентов;
Настройка auto-scaling policies на основе CPU, memory, GPU метрик;
Управление persistent volumes для vector DB и кэша.
Навыки, которые нам необходимы:
3+ лет опыта с Kubernetes в production (deployment, scaling, networking, storage);
Глубокое понимание Kubernetes architecture, controllers, API objects;
Опыт с Helm для package management и templating;
Опыт с container runtime (Docker, Podman, containerd);
Знание networking и service discovery в Kubernetes;
3+ лет опыта с CI/CD pipelines (GitLab CI, Jenkins, GitHub Actions);
Опыт с artifact registry и container image management;
Знание deployment стратегий (rolling, canary, blue-green);
Опыт с pipeline troubleshooting и optimization.
То, что ждет вас в команде:
Талисман качества
Астана
от 400000 KZT
СпецГазМонтаж
Астана
до 1000000 KZT
РГП на ПХВ Инженерно-технический центр Управления Делами Президента Республики Казахстан
Астана
до 1000000 KZT