В команду премиальной поддержки ищем сервис-менеджера on-premises инфраструктуры XDR для одной из крупнейших и самых высоконагруженных инсталляций eXtended Detection and Response (XDR) — с интегрированными компонентами классов IRP, SIEM (KUMA), EDR, система управления антивирусом (KSC).
В этой роли вы будете развивать сервис и обеспечивать его стабильную эксплуатацию: много общаться с клиентом, работать в связке с технической поддержкой, командой SOC-аналитиков, разработкой, а также интегратором, обеспечивающим поддержку инфраструктуры. Важно уметь соединять потребности бизнеса и «технику» — и вместе с клиентом строить понятную дорожную карту развития решения в его инфраструктуре, учитывая планы клиента и наш роадмап по XDR.
Основные задачи:
- Развивать и сопровождать сервис XDR и его инфраструктуру совместно с интегратором (операционные системы, серверы и системы хранения, сетевое оборудование), обеспечивая стабильность, производительность и масштабируемость.
- Совместно с клиентом согласовывать план развития сервиса: ожидания и приоритеты клиента; текущие возможности решения; будущий product roadmap XDR.
- Совместное с клиентом управлять изменениями в сервисе XDR, учитывая влияние на инфраструктуру: подключение новых источников/сенсоров, рост потока событий и нагрузок, изменения правил нормализации/корреляции, изменение сроков хранения и политик; оценка рисков и влияния, планирование работ/окон, согласование с клиентом, контроль внедрения и пост-проверки.
- Формировать и вести план регулярного обслуживания и проактивной профилактики рисков эксплуатации (capacity-планирование, контроль деградаций, регулярные проверки интеграций, рекомендации по hardening настройкам).
- Координировать работу интегратора, и вовлечённых команд Лаборатории Касперского (Professional Services и Technical Support) в формате «единого окна» по всем вопросам клиента.
- Лично подключаться к разбору инцидентов и координировать восстановление сервиса при сбоях (до полного восстановления и фиксации корректирующих действий).
- Регулярно взаимодействовать с продуктовой командой и разработкой XDR: передавать обратную связь клиента, инициировать улучшения, сопровождать устранение дефектов и RCA по сбоям/инцидентам.
- Выявлять, формализовать и выносить риски эксплуатации сервиса (технические, процессные, ресурсные) на уровень аккаунт-команды; обсуждать вводные и предлагать варианты митигации, фиксировать договорённости и дальнейшие действия со сроками и ответственными.
Какие результаты от Вас ожидаются:
- Стабильная работа сервиса XDR в инфраструктуре клиента: высокая доступность и производительность, отсутствие незапланированных и несогласованных простоев.
- Прозрачное и управляемое внедрение изменений: изменения согласованы, выполняются в окна, проходят пост-проверки, без негативного влияния на сервис.
- Инженерные работы по XDR выполняются в согласованные сроки и с ожидаемым качеством.
- Сформирована и исполняется совместная дорожная карта развития сервиса XDR у клиента (приоритеты согласованы, прогресс отслеживается на регулярных ревью).
- Минимизация критичных эскалаций: решение проблем в режиме единого окна, с понятными сроками и ответственными.
Какие навыки Вам необходимы:
- Навык кросс-функционального взаимодействия: выстраивать работу «в одной связке» с разработкой, продуктовой командой, SOC, технической поддержкой, Professional Services, интегратором в рамках субподряда.
- Опыт эксплуатации и администрирования высоконагруженных инсталляций SIEM/IRP/SOAR (EPS>100 000), включая мониторинг, тюнинг, интеграции, troubleshooting, планирование и оптимизация нагрузки.
- Практический опыт управления изменениями в продукте, проведение работ в согласованные окна, контроль влияния и пост-проверки.
- Опыт применения Python, Bash для интеграций.
- Координация работы интегратора для поддержки инфраструктуры, на которой работает XDR:
- ClickHouse, PostgreSQL, SQLite (резервное копирование/восстановление, репликация/HA, оптимизация запросов, тюнинг).
- Контейнеризация и оркестрация: Kubernetes K8S (deploy/upgrade, networking, storage, troubleshooting, базовая безопасность, наблюдаемость).
- Astra Linux 1.7 «Воронеж» и выше (bonding/team, аудит и журналирование, hardening, performance-тюнинг).
- Аппаратная платформа и storage: серверы YADRO, RAID (уровни, отказоустойчивость, деградации).
- Компьютерные сети для высоких нагрузок: NIC teaming/bonding, предотвращение сетевых проблем (потери, дубликаты MAC, ошибки LACP/bonding, влияние неисправного оборудования).
- Базовые инфраструктурные сервисы предприятия: MS AD DS, ALD Pro, DNS, DHCP (интеграции, эксплуатация).