Международная продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках SRE-инженера в платформенную команду Kubernetes Operations.
Команда Kubernetes Operations отвечает за операционные задачи K8s-кластеров: обновление кластеров и аддонов, работу с ОС, а также совершенствование системы контроля кластеров.
Почему эта позиция интересна:
Масштаб - десятки production K8s-кластеров, 2000+ серверов
Критичность - обновления без даунтайма на high-load системах (500K+ RPS)
Автоматизация - выстраивание процессов для zero-touch operations
Команда 20+ инженеров - ресурсы для реализации амбициозных проектов
Без ночных дежурств - отдельная команда поддержки, здоровый work-life balance
Современный стек - Kubernetes, GitOps, Ansible/AWX
Философия команды - автоматизируем всё, что можно автоматизировать
Чем предстоит заниматься:
- Обновление кластеров и аддонов:
- Планировать и выполнять обновление Kubernetes-кластеров (minor и major версии)
- Обновлять cluster addons: CNI (Cilium/Calico), CSI (Rook), Ingress controllers, cert-manager
- Настраивать и поддерживать бэкап кластеров (Velero)
- Тестировать обновления на staging перед production rollout
- Разрабатывать и поддерживать процедуры rollback
- Kоординировать maintenance windows с продуктовыми командами
- Работа с ОС:
- Управлять жизненным циклом ОС на нодах (Ubuntu)
- Автоматизировать patching и security updates
- Оптимизировать kernel parameters для K8s workloads
- Управлять node images и их версионированием
- Контроль кластеров:
- Развивать систему health checks и compliance проверок кластеров
- Внедрять policy enforcement (Kyverno, OPA Gatekeeper)
- Автоматизировать аудит конфигураций кластеров
- Строить дашборды для контроля состояния кластеров
- Внедрять GitOps для управления конфигурациями (ArgoCD, Gitlab Agent)
- Автоматизация:
- Автоматизировать рутинные операции с помощью Ansible/AWX
- Разрабатывать CI/CD пайплайны для инфраструктурных изменений (GitLab CI)
- Писать скрипты и утилиты на Python/Go/Bash
Необходимые навыки и опыт:
- Опыт работы с Kubernetes в production от 3 лет
- Опыт обновления Kubernetes-кластеров в production
- Глубокое знание Linux (Ubuntu): systemd, networking, kernel tuning
- Опыт с Ansible/AWX для автоматизации
- Опыт с GitOps (ArgoCD, Flux)
- Знание CI/CD (GitLab CI)
- Понимание архитектуры Kubernetes: kubelet, container runtime, CNI, CSI
- Навыки программирования на Python или Bash
- Понимание сетей: TCP/IP, iptables/nftables, DNS
Будет плюсом:
- Опыт с Cilium или Calico CNI
- Знание Go для написания утилит
- Опыт с Kyverno или OPA Gatekeeper
- Опыт работы с bare metal Kubernetes (не только managed)
- Опыт с PXE boot и автоматическим provisioning нод
- Сертификации Kubernetes (CKA, CKS)
Условия:
- Работа в современном офисе в Лимасоле
- Гибкое начало рабочего дня с 8:00 до 10:30
- Русскоговорящая команда, поддерживающая атмосфера, очень дружелюбный коллектив коллег
- Реальные возможности роста и развития
- Завтраки и обеды за счет компании в офисе
- Прекрасные корпоративные (развлекательные, спортивные, образовательные) мероприятия в течение года - как для сотрудников, так и для их детей
- Компенсация занятий английском языком 50% стоимости (в SkyEng)