Наша команда занимается решениями по обработке и аналитике больших данных. Мы разрабатываем сервисы и занимаемся развитием вычислительных и дата платформ для исследования угроз. Постоянно ищем наиболее оптимальные решения наших задач и для этого мы используем сотни серверов и петабайты данных, обширный стек технологий. Нам важно создавать надежные, масштабируемые и высокопроизводительные решения.
Чем предстоит заниматься:
- Поддержка и развитие высоконагруженных распределенных вычислительных платформ компании на стеках Linux, Windows с использованием оркестраторов контейнеров
- Предотвращение и устранение аварий, выявление причин возникновения;
- Автоматизация процессов работы с платформами и развитие IaC;
- Развитие мониторинга и логирования на платформах;
- Выполнение требований в области ИБ на платформах.
Что требуется от вас:
- Опыт работы с ОС Windows
- использования PowerShell для автоматизации выполнения типовых задач администрирования;
- построения и администрирования отказоустойчивых систем с использованием технологий Microsoft, Failover Cluster
- Опыт работы с ОС Linux;
- работы с K8s, RBAC, Ceph;
- использования IaC, предпочтительно Ansible, bash;
- работы с метриками Prometheus/PromQL/Grafana;
- Опыт построения больших отказоустойчивых решений;
- Опыт написания скриптов автоматизации на одном из скриптовых языков ruby/python/etc;
- Опыт сопровождения CI/CD;
- Опыт эксплуатации HAproxy/Nginx + Load balancing.
Будет плюсом:
Опыт работы c:
- OKD;
- Распределенными системами мониторинга Prometheus/VictoriaMetrics;
- ELK стеком;
- Экосистемой Hadoop (Spark/Kafka/Impala/HBase/AirFlow);
- Scylladb;
- ClickHouse;
- Azure DevOps;
- Опыт разработки на Java/Golang/Python/Ruby/C;
- Опыт сборки пакетов rpm/deb