Сейчас мы ищем Performance Engineer (Observability & Reliability).
О команде:
Наши инженеры являются часть команды SRE и занимаются разработкой платформы нагрузочного тестирования, хаос-инжинирингом, помогают внедрять нагрузочные тесты.
От успешного соискателя мы ожидаем:
- Уверенных знаний подходов и методологий тестирования производительности (обязательно уметь отличать один тип тестов от другого и уметь создавать профили нагрузки);
- Опыта создания сценариев для проведения нагрузочного тестирования и их реализации;
- Опыта работы с любым средством тестирования производительности (HP LoadRunner, JMeter, Yandex.Tank, Gatling);
- Опыта разработки заглушек/эмуляторов на любом языке программирования;
- Опыта тестирования клиент-серверных приложений (желательно с микросервисной архитектурой под капотом) и понимания принципов их работы и построения;
- Уверенное владение одним из языков программирования (Java, C#, Go, Python;
- Умения и желания анализировать результаты нагрузочного тестирования, локализовать проблему;
- Понимания какие нужно собирать метрики при проведении тестирования производительности и для чего они нужны.
Чем предстоит заниматься:
- Мы не занимаемся нагрузкой продуктов, вместо этого мы разрабатываем, развиваем и внедряем наш инструментарий нагрузочного тестирования в команды и инфраструктуру;
- Мы не пишем методики и не проводим долгий анализ результатов, вместо этого мы автоматизируем root cause detection, развиваем quality gate и делаем автоотчеты;
- Наши инженеры - это часть команды SRE, поэтому мы являемся владельцами сущности проблемы от архитектурного комитета до проблем менеджмента после инцидента.
Стек:
- Back: Kotlin/Ruby/Golang/Elixir/PHP, microservices, Kafka;
- Database: PostgreSQL/MSSQL/Elasticsearch/MySQL;
- CI/ CD: GitLab, Kubernetes (Openshift), Argo CD.
Инструменты для тестирования:
- Используем jmeter-java-dsl, gatling и пишем к ним собственные библиотеки, запускаем тесты с помощью gitlab-ci/argocd, развиваем собственный backend-сервис для управления нагрузкой, автоанализа результатов и генерации отчетов;
- Для заглушек применяем mock-server + самописные extensions;
- Используем Ansible для автоматизации развертывания инфраструктуры и конфигурации тестовых стендов, bash-скрипты для автоматизации рутинных задач и интеграции инструментов; Применяем различные профильные утилиты (например, iperf);
- Логи/ Мониторинг: Kibana (EFK), Grafana Tempo, Grafana, VictoriaMetrics.