Команда Банка Ozon создаёт и развивает сервисы для покупателей и продавцов. Мы строим банк как современный IT-продукт — с передовыми технологиями и микросервисной архитектурой. Все самые сложные и важные системы банка реализуем сами: процессинг, учётное ядро, финансовый мониторинг, переводы через Систему быстрых платежей. Среди наших продуктов — виртуальная и пластиковая карта для выгодных покупок на Ozon и за его пределами, рассрочка, банк для юридических лиц и программы финансирования продавцов.
Ищем опытного инженера Kubernetes, который поможет нам развивать и поддерживать инфраструктуру наших сервисов и платформу для запуска финансовых продуктов.
Технологии, которые мы используем:
IaaS: Proxmox, Ubuntu, Qemu + KVM, Prometheus, Terraform, Ansible
PaaS: Kubernetes, Docker, Containerd, Swarm, Prometheus, Vault, Keycloak, GitLab + Git, Terraform, Ansible, Nginx, Notary и другие.
Вам предстоит:
- Строить и эксплуатировать кластеры Kubernetes в различных конфигурациях
- Создавать и сопровождать конфигурации для Kubernetes и деплоймент системных компонентов
- Развивать общую инфраструктуру — разработка инфраструктурного кода и способов его деплоя, покрытие этого кода тестами
- Сотрудничать с командами-потребителями Kubernetes
- Разрабатывать автоматизацию, упрощающую работу команды
- Разрабатывать различный тулинг вокруг OpenSource, если нужно, то патчить его
- Troubleshooting сложных кейсов
- Автоматизировать развертывания инфраструктуры
- Оказывать техническую поддержку разработчикам, как 3 линия
Мы ожидаем:
- Наличие глубоких знаний технологий контейнеризации: Docker / Containerd / CRI-O
- Наличие экспертного опыта работы с оркестратором Kubernetes
- Понимание, как функционируют компоненты кластера Kubernetes на низком уровне
- Понимание архитектуры и подсистемы ядра Unix и их реализации в Linux (управление процессами, файловые системы, сетевой стек) на уровне системного администрирования
- Наличие опыта эксплуатации высоконагруженных систем.
- Умение автоматизировать рутинные задачи, разрабатывать инструментарий и писать под них тесты (мы пишем на Python / Go, но Bash тоже ок)
- Умение работать с инфраструктурой по принципу Infrastructure as a Code (у нас Ansible / Terraform / Helm / Qbec)
- Знание, какие метрики собирать, куда смотреть при проблемах, какие дашборды для этого нужны (мы используем Prometheus)