Техлид команды эксплуатации (SRE)

ЛАНИТ

Техлид команды эксплуатации (SRE)

Москва, Мурманский проезд, 14к1

Метро: Алексеевская

Описание вакансии

В департамент, выполняющий работы по разработке заказного программного обеспечения под ключ, ищем ТехЛида SRE.

Продуктивная часть проекта представляет из себя следующий набор вычислительных мощностей:

  • Более 300 виртуальных серверов;
  • Около 3000 виртуальных CPU;
  • Более 12 ТБ RAM;
  • Около 680 ТБ данных;

Основной технологический стек проекта:

  • Тип размещения инфраструктуры – облако заказчика;
  • ОС – РедОС 7;
  • Разработка – JAVA;
  • Application Server – Spring Boot;
  • Оркестрация контейнеров – Kubernetes;
  • Реляционная СУБД – Postgres PRO, MariaDB;
  • Нереляционная СУБД – MongoDB;
  • S3 хранилище - Minio;
  • IMDG - Redis, Hazelcast;
  • Брокер сообщений – Kafka;
  • Аутентификация пользователей - Keycloack, openldap;
  • Управление инфраструктурой – Ansible;
  • CI/CD – Jenkins;
  • Хранение кода – selfhosted Gitlab;
  • Мониторинг – Victoriametrics, Grafana;
  • Хранение логов – Opensearch stack.

Задачи:

  • Эксплуатация высоконагруженной системы федерального уровня;
  • Развертывание, администрирование, диагностика проблем JAVA веб-приложений;
  • Развертывание, администрирование, диагностика проблем Kubernetes;
  • Диагностика и устранение проблем с ОС и прикладным ПО;
  • Выстраивание CI/CD конвейера;
  • Развитие и автоматизация инфраструктурных сервисов;
  • Взаимодействие с разработчиками и другими внешними командами;
  • Предоставление различным командам инструментов для улучшения их процессов. Внедрение подходов Infrastructure-as-a-Code;
  • Планирование и развитие инфраструктуры промышленного контура системы;
  • Проработка архитектуры внедряемых изменений;
  • Прогнозирование роста вычислительных ресурсов на основании органического роста системы и планов по ее развитию;
  • Координация задач по развитию инфраструктуры;
  • Формирование требований и архитектурный надзор над инфраструктурными задачами;
  • Участие в проектировании инфраструктуры.

Требования:

  • Понимание концепции CI/CD, опыт создания pipeline в одном из CI/CD конвейеров (Jenkins, Gitlab CI, Atlassian Bamboo), умение создать pipeline через скрипты. автоматизации;
  • Опыт администрирования Linux, способность решать проблемы производительности операционной системы;
  • Опыт работы с серверными решениями по виртуализации на уровне пользователя;
  • Знание принципов организации локальных сетей. Опыт организации сложных сетевых конфигураций, включая VPN, NAT, DNAT, сервер маршрутизации;
  • Понимание принципов работы основных веб-протоколов (HTTP, HTTPS, POP3, IMAP, SMTP). Умение анализировать проблемы производительности;
  • Опыт работы с Kubernetes, способность провести анализ проблем производительности;
  • Опыт работы со скриптовыми языками (bash, python);
  • Опыт работы с Ansible, навык написания своих ролей и плейбуков в соответствие с Best Practice;
  • Знание подхода инфраструктура как код, его плюсы и минусы, как этот подход встраивается в приозводство и эксплуатацию;
  • Понимание принципов ведения релизов, понимание gitflow, gitlabflow;
  • Знание принципов SRE;
  • Опыт работы с системами мониторинга – самостоятельное развертывание, организации мониторинга;
  • Опыт работы со стеком ELK, самостоятельное развертывание, организация централизованного сбора логов, настройка парсера, управление индексами;
  • Умение рассчитать трудозатраты и длительность проекта/задачи, длительность, параллельность работ;
  • Умение выбрать инфраструктурное решение, спроектировать, каким образом оно должно работать и провести обоснование выбранного решения;
  • Опыт подготовки эксплуатационной и организационной документации;
  • Умение провести расчет необходимого оборудования под органический рост системы, а также с учетом функциональных изменений.

Условия:

  • ​​​​​​​​​​​​​​Компания является аккредитованной ИТ-компанией;
  • Формат работы: офис/гибрид/удаленно;
  • Стабильная заработная плата (2НДФЛ) + система мотивации;
  • Медицинская страховка после испытательного срока - 3 месяца (стоматология, стационарное лечение, амбулаторное лечение, страхование родственников по корпоративной программе);
  • Техническое комьюнити – цикл мероприятий по обмену опытом и прокачке скиллов на площадке ЛАНИТ;
  • Скидки в сети Inventive Retail Group;
  • Регулярно появляющиеся дополнительные скидки от наших партнеров;
  • Компенсация затрат на спорт: программа вовлеченности.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
Wanted
Полный день
  • Москва

  • Не указана

Рекомендуем
Тривио

DevOps/SRE

Тривио

Полный день
  • Москва

  • Не указана

Рекомендуем
МТС
Удаленная работа
  • Москва

  • Не указана

Эйлер Аналитические Технологии

SRE / DevOps Lead

Эйлер Аналитические Технологии

Полный день
  • Москва

  • Не указана

RUTUBE
Удаленная работа
  • Москва

  • Не указана

БФТ-Холдинг
Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Инфотек

SRE/DevOps engineer

Инфотек

Удаленная работа
  • Москва

  • Не указана

WMT
Удаленная работа
  • Москва

  • от 380000 RUR

МТС
Удаленная работа
  • Москва

  • от 380000 RUR

Звук

SRE Team Lead

Звук

Удаленная работа
  • Москва

  • от 380000 RUR

МФК Займер

Техлид платформы

МФК Займер

Удаленная работа
  • Москва

  • от 380000 RUR

КРОК
Удаленная работа
  • Москва

  • от 380000 RUR

Яндекс
Полный день
  • Москва

  • от 380000 RUR

WINLINE

SRE Engineer

WINLINE

Полный день
  • Москва

  • от 380000 RUR

СБЕР
Полный день
  • Москва

  • от 380000 RUR

Миксвел
Полный день
  • Москва

  • от 380000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию