Инженер мониторинга и надежности (Monitoring & Reliability Engineer)

Комм Клауд

Инженер мониторинга и надежности (Monitoring & Reliability Engineer)

Описание вакансии

CommCloud — аккредитованная ИТ-компания, сопровождающая High Load и High Availability-системы ведущих финансовых организаций России уже более 5 лет.
Мы растём, расширяем портфель решений и выходим в новые отрасли.

В распоряжении команды — более 10 коммерческих дата-центров по России, партнёрство с топ-поставщиками оборудования и ПО, современные облачные решения и стек из 1000+ технологий.
Чтобы всё это работало стабильно и предсказуемо, мы развиваем внутренние практики на базе лучших мировых подходов к управлению ИТ-инфраструктурой.

Чем предстоит заниматься

  • Поддержка и развитие систем мониторинга: Prometheus, Grafana, Zabbix

  • Настройка алертинга и dashboards

  • Сбор, обработка и анализ логов (Opensearch)

  • Работа с метриками, логами и трейсам

  • Расчёт и контроль SLA / SLO / SLI

  • Работа с инцидентами и постмортем-анализом

  • Обеспечение отказоустойчивости систем мониторинга

  • Построение мониторинга высоконагруженных систем с нуля


Требования

  • Высшее образование в области ИТ, компьютерных наук или смежных направлениях

  • От 5 лет опыта в SRE, DevOps или системном администрировании

  • Глубокое понимание принципов надёжности, мониторинга и управления инцидентами

  • Опыт работы с Prometheus, Grafana, Zabbix и системами обработки логов (Opensearch, Elasticsearch и т.п.)

Будет плюсом

  • Опыт работы или понимание AIOps

  • Знание сетевых технологий (TCP/IP, HTTP, gRPC)

  • Опыт performance tuning инструментов мониторинга

  • Опыт работы в системных интеграторах


Условия

  • Удалённый формат работы, график 5/2

  • Гибкий старт рабочего дня

  • Официальное трудоустройство по ТК РФ

  • Компания аккредитована в Минцифре

  • Возможность влиять на архитектуру и развитие мониторинга

  • Дружная команда без микроменеджмента

  • Мягкая адаптация и поддержка на старте

Навыки
  • Prometheus
  • Grafana
  • Zabbix
  • Opensearch
  • Мониторинг инфраструктуры
  • Настройка алертинга
  • Анализ логов
  • Incident Management
  • SLA / SLO / SLI
  • Linux
Посмотреть контакты работодателя

Похожие вакансии

WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
USETECH
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Okko
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
МТС Финтех
Удаленная работа
  • Москва

  • Не указана

Антиплагиат
Удаленная работа
  • Москва

  • Не указана

Айкон Про

SRE/Site Reliability Engineer

Айкон Про

Удаленная работа
  • Москва

  • от 370000 RUR

Интернет-энциклопедия РУВИКИ
Удаленная работа
  • Москва

  • от 370000 RUR

МФК ВЭББАНКИР

Инженер по телефонии

МФК ВЭББАНКИР

Удаленная работа
  • Москва

  • от 370000 RUR

ИК СИБИНТЕК
Удаленная работа
  • Москва

  • от 370000 RUR

Честный знак.рф
Удаленная работа
  • Москва

  • от 370000 RUR

ЮНИМ
Удаленная работа
  • Москва

  • от 370000 RUR

Защищенные Телекоммуникации

DevSecOps Engineer

Защищенные Телекоммуникации

Удаленная работа
  • Москва

  • от 370000 RUR

StormWall™
Удаленная работа
  • Москва

  • от 370000 RUR

Wanted
Удаленная работа
  • Москва

  • от 370000 RUR

X5 Tech
Удаленная работа
  • Москва

  • от 370000 RUR

Мамба
Удаленная работа
  • Москва

  • от 370000 RUR

Банк ДОМ.РФ
Удаленная работа
  • Москва

  • от 370000 RUR

YADRO
Удаленная работа
  • Москва

  • от 370000 RUR

Деньги Вперед

SRE-инженер

Деньги Вперед

Удаленная работа
  • Москва

  • до 350000 RUR

Удаленная работа
  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию