Москва, 2-я Звенигородская улица, 28
Обязанности:
реагировать на инциденты и проблемы (переданные с L2) и оповещения мониторинга;
проводить диагностику, выявлять причины сбоев и восстанавливать работу сервисов;
участвовать в разборе инцидентов и поиске их причин, участвовать в написании postmortem, контролировать выполнение мер по предотвращению повторений инцидентов;
создавать и поддерживать в актуальном состоянии документацию и инструкции для инженеров поддержки L2 и L3;
вместе с SRE работать над повышением надёжности системы (мониторинг, алертинг, поиск/указание слабых мест и т.п.).
Требования:
желание развиваться в области software-defined storage (ceph, cloudian и подобное);
уверенные знания и опыт администрирования Linux;
опыт сопровождения критических информационных систем и инфраструктуры (чем сложнее – тем лучше);
способность принимать взвешенные решения в критической ситуации и умение планомерно работать над поиском причины неисправности и её устранением;
приветствуется знание технологий Openstack;
базовые знания в области сетевых технологий;
умение работать с инструментами мониторинга и логирования (Zabbix / Prometheus, / Grafana / ELK );
готовность к периодическому посещению офиса.
ФГУП ГлавНИВЦ Управления делами Президента Российской Федерации
Москва
Не указана
Смарт Текнолоджис
Москва
от 175000 RUR
Москва
от 175000 RUR