Мы ищем DevOps-инженера, которому интересно строить и развивать сложные отказоустойчивые системы на стыке разных областей. Вы будете создавать и совершенствовать системы, которые служат основой работы Яндекс Образования.
Какие задачи вас ждут:Образовательные продукты построены поверх базовых технологий Яндекса. Но для решения задач конкретной области этих технологий оказывается недостаточно. Нужно на основе общих потребностей нескольких продуктов спроектировать и реализовать решение, которое закроет эти потребности.
Обеспечивать доступность существующих решений, повышать их надёжность и безопасность
Образовательными продуктами пользуются живые люди. При этом сами приложения продолжают развиваться. При активном развитии и изменении программных систем ошибки неизбежны. Наша задача — придумать, как минимизировать влияние ошибок на пользователей. Решение может быть как техническим, так и процессуальным — в виде набора правил и рекомендаций для продуктовых разработчиков.
Анализировать качество предложенных и существующих решений, находить и устранять слабые места
Мы активно участвуем в процессе архитектурной приёмки. Это процесс анализа качества предлагаемых реализаций. Он нужен, чтобы предотвратить разработку плохо спроектированных приложений и зафиксировать артефакт с описанием проблемы и путей её решения.
Оценивать потребности в ресурсах, разрабатывать и внедрять мониторинг систем
При активном развитии наших продуктов требуется составлять долгосрочный план потребления вычислительных ресурсов и следить за тем, чтобы они неожиданно не закончились. А если ресурсов оказывается недостаточно — нужно придумать способ сократить потребление без снижения нагрузки и потери качества.