Привет!
Альфа-Деньги — это команда единомышленников, стабильная растущая финтех-компания.
Мы — часть большого холдинга Альфа-Банка со своим независимым подходом к ведению бизнеса. Вместе мы создали лучший финансовый сервис для миллионов клиентов.
Обязанности
Мы строим системный мониторинг в финтех-продукте 24/7 и формируем мониторинг как сервис для всей компании.
Нам нужен инженер, который станет частью ядра reliability-команды и поможет выстроить архитектуру наблюдаемости с нуля до зрелого уровня.
Архитектура observability
- Совместное проектирование архитектуры мониторинга (Grafana LGTM: Loki, Mimir, Tempo, Prometheus).
- Развитие мониторинга как сервиса для продуктовых и инфраструктурных команд.
- Внедрение и развитие OpenTelemetry.
- Подключение сервисов к сбору метрик, логов и трейсов.
- Настройка exporters, агентов и интеграций.
- Формирование стандартов телеметрии и требований к инструментализации сервисов.
- Поддержка подхода Monitoring as Code: хранение конфигураций в Git, работа через PR и code review.
Метрики, SLI/SLO и алертинг
- Проектирование SLI/SLO для ключевых технических и бизнес-флоу.
- Формирование метрик для критичных участков (скоринг, платежи, интеграции, очереди и др.).
- Пересборка алертинга на основе реального impact, а не технических триггеров.
- Снижение alert noise и устранение ложных/дублирующих срабатываний.
- Написание и оптимизация PromQL и LogQL.
- Автоматизация типовых задач мониторинга (шаблоны алертов, стандартизация конфигураций).
Инциденты и постмортем
- Подключение к инцидентам для технического анализа.
- Работа с метриками, логами и трейсам в рамках RCA.
- Формирование технических action items по итогам постмортемов.
- Внедрение изменений в мониторинг, предотвращающих повторение инцидентов.
- Анализ повторяющихся проблем и системных деградаций.
Дашборды и аналитика
- Построение дашбордов с нуля под конкретные сервисы и бизнес-процессы.
- Создание аналитических витрин для анализа деградаций и трендов.
- Корреляция метрик, логов и трейсов для поиска узких мест.
- Формирование прозрачной картины состояния системы для SRE и бизнеса.
Развитие reliability-культуры
- Участие в формировании стандартов мониторинга и алертинга.
- Помощь командам разработки в корректной инструментализации сервисов.
- Предложение и реализация архитектурных улучшений observability-стека.
- Совместная работа с SRE и Incident Manager по снижению incident rate.
Требования
Технические навыки
- Уверенная работа с Prometheus и Grafana.
- Умение писать сложные PromQL и LogQL-запросы.
- Опыт построения дашбордов с нуля.
- Понимание принципов работы метрик, логирования и распределённых трейсов.
- Опыт настройки exporters и интеграций.
- Понимание OpenTelemetry.
- Базовое понимание Docker.
- Понимание Git и работы с конфигурациями через репозитории (PR, review, ветвление).
Системное понимание
- Понимание распределённых систем и high-load архитектуры.
- Понимание latency, error rate, traffic, saturation.
- Понимание очередей, БД и сетевого взаимодействия на уровне диагностики.
- Опыт работы с Sentry, Zabbix — как плюс.
Мышление и подход
- Инженерное мышление: умение искать первопричину, а не симптом.
- Способность работать с незрелой системой и постепенно доводить её до стандарта.
- Интерес к построению архитектуры, а не только к операционной части.
- Готовность брать ответственность за улучшения и доводить их до результата.
Будет большим плюсом
- Опыт внедрения SLI/SLO с нуля.
- Опыт системного снижения alert noise.
- Участие в postmortem и RCA.
- Опыт автоматизации процессов мониторинга.
- Опыт работы в финтехе или 24/7-продукте.
МЫ:
Соблюдаем ТК РФ:
Предлагаем гибкий формат работы:
-
Возможность удалённо работать;
-
А если тебе захочется поработать офлайн — в твоём распоряжении офис в Москве в урбанистическом стиле, в одной минуте ходьбы от м. Технопарк;
Заботимся о здоровье:
-
С первого дня работы ты можешь выбрать расширенную программу ДМС со стоматологией;
-
Доплата по больничному листу до оклада до 5 рабочих дней в год;
-
Линия психологической поддержки;
-
Врач в офисе и массажные кресла (для сотрудников в Москве);
-
Бесплатные посещения фитнес-клуба А-sport на ст. м. Технопарк;
Профессионально развиваемся:
-
Корпоративная программа профессионального обучения совместно с Альфа Групп (внутренние и внешние программы);
-
Возможность участия в профильных конференциях;
-
Онлайн-библиотека;
-
Карьерное развитие. Ты развиваешься и растешь вместе с командой;
-
Программа наставничества;
-
Профессиональные коммьюнити;
Думаем о каждом:
-
Кафетерий льгот через 6 месяцев – выбирай то, что важно тебе: спорт, организация рабочего места, здоровье, дети, питомцы, благотворительность и др;
-
Корпоративные мероприятия и тимбилдинги в онлайн и офлайн формате;
-
Подарки к праздникам и материальная помощь по особым случаям;
-
+ 3 дня 100% оплачиваемых day off в году.
Интересна вакансия? Отправь отклик! Мы внимательно рассмотрим твое резюме и, если случится мэтч, обязательно свяжемся :)