От 3х лет опыта работы с системами мониторинга: Prometheus, Grafana, Zabbix;
Настройка алертинга и dashboards (Grafana, Zabbix etc);
Сбор, обработка и анализ логов с использованием Opensearch;
Понимание метрик, логов и трейсов;
Расчет и контроль SLA/SLO/SLI;
Опыт работы с инцидентами (Incident Management) и постмортемами;
Обеспечение отказоустойчивости систем мониторинга;
Опыт построения с нуля мониторинга высоконагруженных систем.
Требования:
Высшее образование в области информационных технологий, компьютерных наук или смежных областях;
Не менее 5 лет опыта в области SRE, DevOps или системного администрирования;
Глубокое понимание принципов надежности, мониторинга и управления инцидентами;
Опыт работы с инструментами мониторинга (Prometheus, Grafana, Zabbix и др.), а также с системами обработки и анализа логов (Opensearch).
Будет плюсом:
Опыт работы или понимание AIOps;
Понимание сетевых технологий (TCP/IP, HTTP, gRPC);
Опыт в performance tuning monitoring tools (анализ и оптимизация производительности);
Опыт работы в компания- системных интеграторах.
Условия:
Мы являемся аккредитованной в Минцифре ИТ-компанией, предоставляющей право на льготную ипотеку и право подачи документов на отсрочку от мобилизации для профильных ИТ специалистов;
Удаленный формат работы;
Официальное трудоустройство по ТК РФ;
Возможность участия в развитии современного продукта на рынке с использованием современного стека технологий;