## О роли
Мы ищем опытного DevOps инженера для построения и поддержки надежной инфраструктуры, обеспечивающей бесперебойную работу наших сервисов. Вы станете ключевым звеном в обеспечении стабильности, масштабируемости и безопасности наших систем.
## Ключевые задачи и обязанности
### Инфраструктура разработки и CI/CD
Разворачивание и администрирование сервисов разработки:
- Установка, настройка и поддержка GitLab (self-hosted) и GitLab Runner
- Оптимизация процессов сборки через настройку распределенного кэширования
Развертывание и поддержка внешних реестров:
- Приватный Rust crates registry для управления зависимостями
- Корпоративный Docker registry для хранения и версионирования образов
- Обеспечение работы инфраструктуры в условиях закрытого контура и автономных сред
Автоматизация процессов разработки:
- Проектирование и реализация CI/CD пайплайнов в GitLab CI
- Автоматизация развертывания приложений на различные целевые платформы (облачные провайдеры, VPS, bare metal)
- Управление многоконтурными средами: dev, staging, production
- Оптимизация процессов сборки и доставки кода
### Системы хранения данных
Проектирование и эксплуатация storage-решений:
- Настройка и поддержка RAID-массивов с файловой системой ZFS
- Управление пулами хранения (zpool), реализация шифрования данных на уровне файловой системы
- Развертывание и администрирование распределенной файловой системы SeaweedFS
- Настройка S3-совместимого API для интеграции с существующими приложениями
- Планирование и реализация стратегий резервного копирования
### Kubernetes и контейнеризация
Облачные Kubernetes-кластеры:
- Развертывание и управление управляемыми Kubernetes-сервисами в публичных облаках
- Настройка кастомных StorageClass для интеграции с различными системами хранения
- Оптимизация затрат на облачную инфраструктуру
Bare metal Kubernetes:
- Установка и настройка Kubernetes-кластеров на физических серверах
- Интеграция GPU-ускорителей через NVIDIA GPU Operator
- Настройка GPU Time Slicing для эффективного использования вычислительных ресурсов
- Управление различными версиями CUDA на разных нодах кластера
- Реализация балансировки нагрузки через MetalLB
Контейнеризация приложений:
- Разработка и оптимизация Dockerfile с использованием multi-stage сборок
- Создание и поддержка Helm-чартов для развертывания приложений
- Написание Kubernetes-манифестов (Deployments, Services, ConfigMaps, Secrets, etc.)
- Опыт работы с декларативными системами сборки (Nix/Flake) приветствуется
### Мониторинг и наблюдаемость
Построение системы мониторинга:
- Развертывание и настройка стека Grafana + Prometheus для сбора и визуализации метрик
- Внедрение системы централизованного логирования на базе Loki
- Настройка алертинга и эскалации инцидентов
- Интеграция мониторинга с OpenStack для отслеживания облачных ресурсов
- Создание дашбордов для различных уровней пользователей (разработчики, менеджмент, SRE)
## Требования к кандидату:
### Обязательные навыки:
- Опыт работы с Kubernetes в production-среде от 2 лет
- Глубокое понимание Docker и принципов контейнеризации
- Опыт написания CI/CD пайплайнов (желательно GitLab CI)
- Знание систем мониторинга (Prometheus, Grafana)
- Опыт работы с Linux (администрирование, troubleshooting)
- Понимание сетевых протоколов и принципов работы сети
## Условия:
- Заработная плата обсуждается по итогам собеседования
- Работа в аккредитованной IT компании
- Гибкий график 5/2, плавающее начало дня, возможны гибрид и удалёнка
Москва
Не указана
Москва
Не указана