Мониторинг в реальном времени (серверы, сеть, сервисы, облака).
Реагирование на инциденты (триггеры в Zabbix, алерты Prometheus, обращения пользователей).
Эскалация проблем (уведомление ответственных команд).
Ведение логов дежурств (фиксация времени реакции, причин сбоев).
Работа с системами мониторинга: Zabbix, Prometheus + Grafana, VictoriaMetrics.
Обработка логов (ELK Stack, Graylog, Loki).
Администрирование ОС: Linux (CLI, журналы, cron, systemd), Windows Server (Event Viewer, Performance Monitor).
Сетевые технологии: понимание TCP/IP, DNS, DHCP, VPN.
Навыки диагностики сетевых проблем (ping, traceroute, netstat).
Базовый скриптинг: Bash/Python для автоматизации рутинных задач.
Умение оперативно реагировать на инциденты (падение серверов, сетевые атаки, перегрузка каналов).
Навыки ведения документации (отчеты о сбоях, журналы дежурств).
Готовность к ночным сменам и работе в режиме on-call.