Москва, Старопетровский проезд, 11к1
Метро: ВойковскаяМы ищем специалиста, который возьмёт на себя операционную надёжность данных и раннее обнаружение проблем в инфраструктуре компании.
Обязанности:
Администрирование и развитие корпоративной системы резервного копирования (Veeam / Commvault / Rubrik / Bacula / Кибер Бэкап / Spectrum Protect и др.)
Ежедневный контроль выполнения всех backup-задач, анализ ошибок и пропущенных заданий
Регулярное тестирование восстановления (file-level, VM, application-aware, bare-metal)
Управление политиками хранения, дедупликацией, репликацией копий (on-prem → облако / DR-сайт)
Участие в проектировании и внедрении новых сценариев резервного копирования (новые системы, СУБД, Kubernetes, SaaS)
Администрирование и развитие системы мониторинга (Zabbix / Prometheus + Grafana / VictoriaMetrics / Nagios / Checkmk / SolarWinds / PRTG и др.)
Создание и поддержка дашбордов, алертов, автоматических реакций (runbooks / ansible-playbooks / интеграция с Telegram / Slack / ServiceNow)
Мониторинг ключевых метрик инфраструктуры: CPU / RAM / диск / сеть / температура / доступность сервисов / успешность бэкапов
Обеспечение требуемого RPO и RTO работы критичных бизнес приложений
Участие в расследовании инцидентов (root cause analysis) совместно с другими командами
Ведение актуальной документации: схемы, регламенты, runbooks, матрица ответственности по восстановлению
Участие в проектах DR / BCP (Disaster Recovery / Business Continuity)
Опыт администрирования систем резервного копирования от 2–3 лет
Хорошее знание хотя бы одной из систем: Veeam Backup & Replication / Commvault / Rubrik / Cohesity / Bacula / Кибер Бэкап
Опыт администрирования систем мониторинга от 2 лет (Zabbix / Prometheus / Grafana — будет преимуществом)
Уверенное владение Linux (Debian / Ubuntu / RHEL / Astra) на уровне администратора
Уверенное владение Windows Server 2019–2025 (AD, PowerShell)
Понимание принципов работы виртуализации (VMware vSphere / Hyper-V / KVM / Proxmox)
Опыт работы с СУБД на уровне бэкапа / восстановления (MS SQL, PostgreSQL, Oracle, MySQL/MariaDB)
Умение читать логи, разбирать стеки ошибок, работать с Wireshark / tcpdump при необходимости
Готовность к дежурствам / нестандартному графику при инцидентах
Будет большим преимуществом
Опыт интеграции бэкапов с Kubernetes / OpenShift / контейнерами
Знание объектных хранилищ (S3-совместимые: MinIO, Selectel, AWS, VK Cloud, Yandex)
Опыт настройки ленточных библиотек / VTL
Навыки скриптинга / автоматизации (PowerShell, Bash, Python, Ansible)
Опыт работы с облачными сервисами резервного копирования (Veeam в облаке, AWS Backup, Azure Backup)
Знание принципов 3-2-1 / 3-2-1-1-0
Опыт прохождения аудитов ИБ / ФЗ-152 / 187-ФЗ / PCI DSS
Государственное казенное учреждение Московской Области «Центр Компетенций Госуправления»
Москва
Не указана
iCore (Integration Core)
Москва
от 140000 RUR