Обслуживание и техническое развитие облачной платформы;
Взаимодействие с партнерскими командами по техническим и архитектурным вопросам;
Поддержка и развитие опорных инфраструктурных сервисов. Выработка экспертного уровня знаний по платформе, для оказания 3-го уровня технической поддержки;
Внедрение механизмов автоматизации;
Разработка и выполнять мер, направленные на предотвращение повторных инцидентов;
Участие в разработке процессов, используемых в работе. Подготовка и поддержание сопроводительной документации.
Требования:
Уверенное понимание архитектуры облачных сервисов и моделей предоставления услуг (IaaS, PaaS, SaaS);
На экспертном уровне работа с Linux-системами и их промышленная эксплуатация;
Навыки работы и понимание механизмов виртуализации Qemu/KVM;
Опыт работы с контейнерными средами и платформами их оркестрации (например, Docker\Podman, Kubernetes\OKD);
Владение письменным английским языком для общения с партнерами;
Опыт работы с платформой мониторинга и логирования на базе Victoria Metrics (или Prometheus), Alert Manager, Grafana, Opensearch (ELK), в том числе настройка сборщиков метрик, получения логов от приложения и настройка на их основе дашбордов, создание модификация дашбордов в Grafana\Kibana;
Понимание принципов работы SDN (OVN, OVS, Tungsten Fabric);
Понимание принципов SDS (Ceph, MiniIO);
Опыт работы с системами управления конфигурациями Ansible, Terraform для описания инфраструктуры Infrastructure as Code.