Проект Цифровая Платформа Выборы
Цифровая платформа — это решение для цифровизации деятельности ЦИК России и избирательных комиссий всех уровней.
Платформа обеспечивает прохождение всех этапов процесса избирательных кампаний и заменяет текущую систему ГАС "Выборы", созданную более 30 лет назад.
Цель вакансии: Построить и обеспечить бесперебойную работу системы мониторинга ИТ-инфраструктуры компании.
Команда: 2-3 человека в развитии. Дежурная смена отдельно.
Мы предлагаем:
- Официальное трудоустройство по ТК РФ
- Гибридный график работы (1-2 раза в неделю нужно приезжать в ЦИК)
- ДМС со стоматологией и кафетерий льгот
- Возможность профессионального роста
- Корпоративное обучение: внутренние митапы, участие в конференциях, доступ к корпоративным библиотекам технической и бизнес литературы
Задачи:
- Провести аудит текущей инфраструктуры и выявить все критичные точки для мониторинга (серверы, сервисы, приложения, сети, БД и т.д.).
- Сформировать требования к системе мониторинга: SLA, метрики, алерты, интеграции, масштабируемость.
- Обеспечить интеграцию мониторинга с системами оповещений (email, Telegram и др.).
- Настроить сбор метрик, логов, трассировок (observability).
- Разработать и внедрить процессы реагирования на инциденты (алерты, эскалация, post-mortem)(есть дежурная смена, которые смотрит на дашборды)
- Обеспечить прозрачную визуализацию состояния инфраструктуры для заинтересованных сторон (дашборды, отчёты).
- Организовать регулярное тестирование системы мониторинга (failover, нагрузка, отказоустойчивость).
- Подготовить документацию по архитектуре мониторинга, стандартам метрик, процедурам реагирования.
- Провести обучение команды эксплуатации и разработчиков по работе с системой мониторинга.
- Постоянно отслеживать новые opensource-решения и best practices.
- Обеспечить масштабируемость и гибкость системы мониторинга под рост инфраструктуры.
- Внедрить инструменты ИИ для анализа метрик
- Управлять командой по развитию мониторинга
- Автоматизировать процессы по развертыванию, конфигурированию, обслуживанию, модернизации систем мониторинга.
Технические компетенции
- Экспертные знания современных систем мониторинга (Prometheus, Grafana, Zabbix, ELK)
- Понимание принципов построения отказоустойчивых систем мониторинга
- Знание методологий SRE, DevOps, ITIL
- Опыт работы с инструментами сбора метрик, логов и трассировки
- Знание основ сетевых технологий и протоколов
- Экспертиза в области алертинга и построения дашбордов
- Опыт использования инструментов автоматизации, Ansible, terraform, оркестраторы (Jenkins, GitlabCI, TeamCity)
Управленческие навыки
- Опыт руководства технической командой
- Навыки стратегического планирования развития систем мониторинга
- Способность к расстановке приоритетов и управлению ресурсами
- Умение выстраивать эффективные процессы реагирования на инциденты
- Опыт оптимизации процессов мониторинга и автоматизации рутинных задач
Будет огромным плюсом
- Опыт работы инженером DevOps