Требования:
Релевантный опыт работы от 3-х лет;
Опыт администрирования и управления Proxmox VE и виртуальными машинами (Linux: Ubuntu/Debian, Windows Server);
Опыт работы с SDS (Software-Defined Storage), ключевая составляющая – CEPH;
Опыт работы с компонентами CEPH: RBD, FS, S3;
Опыт построения и сопровождения кластерных отказоустойчивых систем;
Работа с распределёнными дата-центрами;
Опыт настройки и поддержки систем резервного копирования и Disaster Recovery;
Установка обновлений и патчей на серверах и виртуальных машинах;
Знание сетевых технологий: TCP/IP, VLAN, LACP, bonding;
Опыт работы с сетевым оборудованием и коммутаторами: Cisco, Mikrotik;
Мониторинг и логирование: Zabbix, Prometheus, ELK;
Автоматизация и скрипты: bash, PowerShell, Python, Ansible;
Опыт работы с контейнеризацией и CI/CD: Docker, Kubernetes;
Понимание архитектуры распределенных и отказоустойчивых систем;
Применение ITIL-практик для управления ИТ-сервисами, инцидентами, проблемами и изменениями.
Дополнительные требования:
Опыт работы в крупных корпоративных инфраструктурах или дата-центрах;
Умение разрабатывать и поддерживать документацию и регламенты для инфраструктурной команды;
Опыт взаимодействия с подрядчиками и поставщиками оборудования;
Умение анализировать производительность серверов, виртуальных машин и систем хранения данных;
Способность планировать масштабирование и оптимизацию инфраструктуры;
Опыт внедрения процессов автоматизации и стандартизации рабочих процедур;
Опыт построения масштабируемых и высокодоступных кластеров;
Опыт работы с контейнеризацией и оркестрацией: Docker, Kubernetes, CI/CD процессы;
Опыт оптимизации процессов резервного копирования и восстановления.
Задачи:
Проектирование, внедрение и сопровождение серверной инфраструктуры на базе Proxmox VE и виртуальных машин (Linux, Windows Server);
Администрирование и оптимизация решений SDS (CEPH: RBD, FS, S3);
Построение и сопровождение кластерных отказоустойчивых систем;
Поддержка инфраструктуры в распределенных дата-центрах;
Разработка и поддержка систем резервного копирования и Disaster Recovery;
Обеспечение стабильной работы серверов и ВМ, включая установку обновлений и патчей;
Мониторинг и логирование с использованием Zabbix, Prometheus, ELK;
Автоматизация рутинных задач и процессов с использованием bash, PowerShell, Python, Ansible Поддержка контейнеризации и CI/CD процессов (Docker, Kubernetes);
Документирование процессов, создание регламентов и инструкций для команды;
Применение ITIL-практик для управления инцидентами, проблемами, изменениями и сервисами;
Планирование масштабирования, оптимизации и повышения отказоустойчивости инфраструктуры.
Мы предлагаем:
Москва
Не указана
Москва
Не указана
Электронная торговая площадка Газпромбанка
Москва
Не указана
Axenix (ранее Accenture)
Москва
Не указана
Москва
Не указана
Москва
Не указана