В Nomium - мы создаем масштабные блокчейн-проекты с высоконагруженными системами. Сегодня нас 40+ человек, работающих по всему миру. Мы строим инфраструктуру как продукт: прозрачный, отказоустойчивый и полностью автоматизированный.
У нас настоящий High-load: интенсивные потоки транзакций и строгие требования к стабильности. Если ты считаешь, что любая правка руками в проде - это ошибка, а GitOps - единственный верный путь, нам точно по пути.
Чем предстоит заниматься:
Надежность и эксплуатация
Эксплуатация Kubernetes-контуров: стабильность, обновления, политика изменений.
SLO/алерты/реакция на инциденты: снижение MTTR через runbook’и, метрики, понятные процедуры.
Диагностика «почему упало/тормозит» на уровне инфраструктуры, сети, приложений и баз (в зоне DevOps).
CI/CD и доставка
Развитие GitLab CI: шаблоны, унификация, ускорение сборок, контроль артефактов/образов, предсказуемые релизы.
Доставка в Kubernetes через ArgoCD: GitOps, promotion между окружениями, контроль drift’а.
Формализация релизного процесса: версии, откаты, миграции, чек-листы.
IaC и конфигурация
Поддержка и развитие инфраструктуры в Terraform (Yandex Cloud) и конфигураций в Ansible.
Стандартизация: структура репозиториев, модули, переменные, секреты, окружения.
Observability и инцидент-менеджмент
Мониторинг и логи: Prometheus + Grafana, Loki, Tempo, CoRoot.
Улучшение сигналов: алерты без шума, корректные лейблы, дашборды под инциденты и capacity planning.
Практика «увидел → понял → сделал → зафиксировал»: документация и runbook’и.
Платформенная эксплуатация данных
Managed PostgreSQL и managed ClickHouse: бэкапы, ретеншн/ротации, лимиты, мониторинг, отказоустойчивость.
RabbitMQ / Redis (dev и PROD): стабильность, наблюдаемость, типовые аварии, capacity.
Безопасность в DevOps-контуре
Базовая безопасность: секреты, доступы, разграничение прав, контроль образов, минимизация blast radius.
Security-практики в CI/CD без «театра безопасности», только рабочие меры.
Активное участие в поддержке инфраструктуры, возможны ночные дежурства (в перспективе и с отдельной компенсацией).
Требования:
Senior-уровень в эксплуатации прод-инфраструктуры на Kubernetes.
Уверенная работа с Terraform и понимание жизненного цикла изменений.
Уверенная настройка и поддержка CI/CD на GitLab CI с доведением до стандарта.
Опыт построения observability (метрики/логи/трейсы) и расследования инцидентов по сигналам.
Понимание эксплуатации Postgres/ClickHouse на уровне платформы: бэкапы, ретеншн, лимиты, мониторинг, типовые проблемы.
Навык писать понятные runbook’и и автоматизировать рутину.
Привычка фиксировать знания в репозиториях: IaC, документация, runbook’и.
Командная работа и обмен опытом.
Будет плюсом:
Yandex Cloud: IAM, VPC, security groups, Managed Kubernetes, Container Registry/Lockbox (или аналоги).
Nginx/HAProxy.
Практики: SLO/SLI, incident management, postmortem, capacity planning.
Опыт поддержки high-load систем.
Условия и бонусы:
Интересные и технологичные проекты: создание и развитие блокчейн-проектов с экстремальными нагрузками, где ты сможешь внедрять передовые подходы (GitOps, eBPF-мониторинг) в профессиональной среде.
Глобальная команда: 40+ специалистов по всему миру, культура доверия, автономии и отсутствие бюрократии.
Remote-first: полная удаленка, работай из любой точки мира.
Гибкость и развитие: фокус на результат, участие в жизни SRE-сообщества и работа с современным стеком.
Занятость: Full-time.
Доход: обсуждается по результатам интервью.
Карпинский Виктор Александрович
Минск
до 4000 USD
Иностранное унитарное предприятие Адмитад
Минск
до 4000 USD
Минск
до 4000 USD
Минск
до 4000 USD
ПБК Менеджмент
Минск
до 4100 USD