DevOps-инженер

Одиссей-Инфо

DevOps-инженер

Москва, 3-я улица Ямского Поля, 9

Метро: Белорусская

Описание вакансии

Мы ищем Middle/Senior DevOps-инженера, который присоединится к нашей команде для построения и развития надежной, масштабируемой и безопасной инфраструктуры.

Чем предстоит заниматься:

  • Развитие инфраструктуры: Проектировать, развивать и поддерживать приложения в собственных контурах с использованием принципов IaC.

  • K8s: Разворачивать и приводить к стандарту k8s-кластеры (сети, ingress, storage, секреты, autoscaling).

  • CI/CD: Настраивать и поддерживать эффективные процессы непрерывной интеграции и доставки (CI/CD) на основе GitLab Flow.

  • Автоматизация: Автоматизировать рутинные операции с помощью Ansible, Terraform.

  • Мониторинг и логи: Развивать систему мониторинга и сбора логов (Grafana, ELK-stack) для оперативного контроля и предотвращения инцидентов.

  • Техническая поддержка: Участвовать в устранении инцидентов (troubleshooting) на всех уровнях стека — от сети и ОС до приложений.

Требуесый опыт (3+ лет на позициях DevOps/SRE):

  • Kubernetes: администрирование production кластеров, работа с Helm, ArgoCD, понимание Service Mesh (Istio).

  • Умение работать с Bare-metal и работать не с облачными managed-решениями.

  • Автоматизация и IaC: практический опыт Terraform, Ansible.

  • CI/CD: опыт настройки пайплайнов GitLab CI, Jenkins, понимание Gitlab Flow, trunk-based development.

  • Мониторинг: навыки настройки Prometheus, Grafana, ELK Stack, опыт с observability инструментами.

  • Программирование: уверенные навыки Python и Bash.

  • Сетевые технологии: TCP/IP, DNS, HTTP, NAT, знание принципов работы сетевых устройств.

  • Опыт построения отказоустойчивых конфигураций Kafka, Redis.

Будет плюсом:

  • Опыт с высоконагруженными системами (highload).

  • Опыт программирования Go.

  • Сертификации: AWS Certified DevOps Engineer, Azure Administrator, GCP Professional Cloud Architect.

  • Опыт в Machine Learning / Data Platform инженерии.

Цели команды и метрики успеха:

  • TTFD (Time To First Deployment): разработка нового сервиса или фичи выходит в production за часы, а не дни или недели.

  • MTTR (Mean Time To Recovery): стабильное снижение времени восстановления после инцидентов.

  • Alarmfatigue prevention: алерты без шума, каждый alert действителен, настроены runbooks и playbooks для автоматизированного реагирования.

  • IaC-покрытие инфраструктуры: 90%+ кода инфраструктуры в версионной системе (Git).

  • Disaster Recovery: регулярные DR-тесты в заданные RTO/RPO, документирование стратегии восстановления.

  • Автоматизация: минимизация ручных операций, экономия ресурсов, снижение операционных затрат (CapEx/OpEx).

Навыки
  • DevOps
  • Kubernetes
  • ELK
  • Gitlab
  • Kafka
  • GitLab CI
  • Go
  • PostgreSQL
  • Prometheus
  • Grafana
  • Docker
  • Linux
  • Terraform
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию