На данный момент мы ищем Инженера SRE, который будет работать с компанией «ВкусВилл».
Направление «ВкусВилл» занимается комплексной автоматизацией цифровой экосистемы ритейлера уже более 13 лет. В работе используем 1С, MS SQL, GO. В составе направления более 700+ IT-специалистов уровня middle и senior.
Что предстоит делать:
-
Поддержка команд и сервисов направлений со стороны инфраструктуры;
-
Обеспечение надежности и масштабируемости системы;
-
Выявление и устранение узких мест в производительности;
-
Настройка систем мониторинга, логирования и трейсинга;
-
Предотвращение потенциальных сбоев;
-
Оптимизация CI/CD пайплайнов, внедрение инфраструктуры как кода (IaC) и автоматизация рутинных задач;
-
Продвижение практик DevOps в сторону разработки: внедрение best practices DevOps, таких как мониторинг SLA, SLO, SLI, анализ инцидентов (postmortem) и управление изменениями;
-
Обеспечение безопасности, надежности, отказоустойчивости и быстрого восстановления после сбоев платформы;
Мы ждем от вас:
- Практический опыт в администрировании и поддержке информационных систем семейства Linux (Debian);
- Владение shell-скриптингом (bash, python) в качестве инструментария для автоматизации рутинной деятельности;
- практический опыт применения систем оркестрации контейнеров (kubernetes, docker-compose, docker swarm);
- Практический опыт по работе с контейнерами (docker), основы построения Dockerfile и лучших практик в этой области;
- Владение системами управления конфигурациями и развертыванием приложений (ansible, terraform) и практический опыт применения таких систем в процессах построения IaC (Infrastructure as Code);
- Применение инструментов GitLAB CI (написание пайплайнов) и Jenkins;
- Практический опыт применения в работе и администрирования систем мониторинга на базе Prometheus, Zabbix, Grafana, Alert Manager, BlackBox;
- Практический опыт взаимодействия с системами потоковой передачи событий (Kafka, RabbitMQ);
- Знание систем управления agile, тикетных систем (Atlassian Jira, Bookstack и тд) и систем для совместной работы над накопленными знаниями (Atlassian Confluence и другие Wiki);
- Практический опыт применения web-серверов и балансировщиков нагрузки (Nginx, Haproxy);
- Практический опыт применения систем управления реляционными базами данных (PostgreSQL и MySQL), их кластеризация на базе Galera Cluster, Patroni, а также колоночной СУБД ClickHouse;
- Практический опыт применения NoSQL и Key-Value систем (ElasticSearch, ETCD, Redis, Zookeeper);
- Практический опыт применения систем централизованного сбора и хранения логов на базе стэков ELK (elasticsearch/opensearch, logstash/ fluentd/fluentbit/vector, kibana), Graylog, Loki;
- Практический опыт применения систем объектного хранения на базе S3 (Minio), а также инструментов доступа к ним.