Сегодня Билайн — компания изменений, чутко реагирующая на потребности рынка и людей.
А ещё Билайн — это команда, объединённая общими ценностями и общей целью — быть лидером телеком и digital рынков, предоставляя нашим клиентам новейшие продукты и услуги, а также сервис самого высокого уровня.
В нашей команде принято уважать друг друга, нести общую ответственность за результат и развиваться.
Нам нужен «Инженер технической поддержки» или «Системный администратор», готовый экспериментировать, применять современные инструменты.
Наша команда занимается поддержкой продукта, предназначенного для автоматизации управления маркетинговыми кампаниями.
Итак, вам предстоит:
Мониторинг работоспособности и производительности сервисов (Kubernetes, Airflow, Hadoop, Kafka).
Оперативное решение инцидентов L2-уровня: анализ логов, диагностика и восстановление работы сервисов.
Поддержка пользователей: консультации по базовым вопросам, помощь в решении проблем с задачами и доступом.
Выполнение рутинных операций: перезапуск задач, управление ресурсами, добавление пользователей, настройка прав доступа.
Самообучение и изучение функциональности существующих систем.
Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:
Знание базовых понятий Apache Kafka (топики, продюсеры, консьюмеры).
Умение просматривать сообщения, проверять статус кластера, перезапускать консьюмеры.
Понимание основных компонентов Apache Hadoop (HDFS, YARN, HIVE).
Умение проверять состояние кластера, загружать/скачивать файлы в HDFS, просматривать и перезапускать/убивать задачи в YARN, создание и удаление баз данных HIVE, управление квотами на дисковое пространство в HDFS/Hive.
Apache Ranger: Базовое понимание политик доступа.
Умение просматривать политики, проверять права пользователей, создавать простые правила.
Опыт работы с GitLab: опыт работы с репозиториями, ветками, Merge Requests. Понимание основ CI/CD для перезапуска пайплайнов.
Опыт работы с системами мониторинга: Grafana или аналогами для анализа метрик и диагностики проблем.
Навыки решения проблем: умение анализировать логи и метрики для поиска корневых причин сбоев в распределенных системах.
Будет плюсом если есть:
Опыт написания скриптов на Python или Go для автоматизации задач.
Знакомство с принципами аутентификации и авторизации (LDAP, Active Directory).
Понимание основ сетевой диагностики.
Опыт работы с системами конфигурации (Ansible).
Знание SQL для выполнения базовых запросов.
Опыт работы с Jira и Confluence.
Что мы предлагаем:
* посещение офиса может быть исключено по согласованию с руководителем