Мы в A1 SolarStore ищем DevOps специалиста на парт-тайм. A1 SolarStore — это маркетплейс на рынке солнечной энергетики. Работаем в США. В 2025 открываем ещё несколько стран.
Ключевое: понятные требования, свобода в принятии решений, минимум бюрократии, интересные задачи, оффер в USD.
Требования:
Linux, CD/CI, Nginx, Grafana, Prometheus, MariaDB, синхронизация/репликация, ротация логов, безопасность
Ответственность за дев/прод, документирование решений и передача знаний (runbooks, diagrams, доки для разработчиков)
Понимание как бороться с парсингами/ddos
Условия:
Если вы устали от кучи собеседований и тестовых, офферов в рублях и хотите расти на международном рынке — давайте к нам. У нас интересно, драйвово и всё по-человечески.
Ближайшие задачи (для тех, кто дочитал и настроен серьезно)
Поднять дашборд в Grafana для отслеживания состояния Nginx-а. Подойдет либо кастомный (дашборд), либо готовый, тут всё зависит от опыта, практики.
Источники “плохих” запросов — 5xx
Статистика по NO PAGE — 4xx
Статистика запросов, вызывающих редиректы — 3xx
И другая нужная, полезная информация по типу TTFB
На основе метрик выше можно будет обсудить с командой целесообразность тех или иных оповещений. Например, появление 5хх ошибок говорит о том, что с приложением что-то не то, надо реагировать — отправляем оповещение. 3хх — пора бы обновить ссылки где-то на сайте, либо еще где на внешнем источнике.
Настроить простую обвязка для борьбы с DDoS-атаками и даже случайным флудом (какой-нибудь скрапер зациклился и начал не по своей воле слать тысячи запросов на ресурсоемкий endpoint, что просто кладет всё наше приложение): ограничение числа запросов в минуту / час, но с обязательной проверкой IP-адреса на принадлежность тому или иному легитимному диапазону, например, диапазон адресов Google-а, Bing-а и другие полезных сущностей, которые не хотелось бы в чем либо-ограничивать.
Настроить автоматическую синхронизацию между боевым и тестовым хостом: синхронизация файлов, изображений, репликация БД, но не абы как, а с предварительной санитизацией чувствительно информации, которая не должна выходить за границы боевого хоста (лишь в исключительных случаях, когда это целесообразно в процессе дебага или разработки).
Настроит ротацию всего чего только можно, чтобы места на жестком диске всегда было в достатке. Ну и просто чтобы всё было чисто.
Реализовать реплику боевой базы на альтернативном хосте, куда можно в случае необходимости направить приложение, если на боевом сервере есть проблемы или еще чего. В общем это скорее про zero-downtime, а не просто сделать реплику и всё. Это всё должно работать и быть протестировано, задокументированно, объяснено.
Проанализировать и сделать рекомендации по безопасности приложения. Возможно на опыте будут явно видно те или иные уязвимости, которые можно и даже нужно устранить для крепкого сна.