K2 Cloud — SRE Challenge

Интерактивный тренажёр для инженеров по надёжности

🎮 Как играть

  • Вы — дежурный SRE-инженер. На сервере произошёл инцидент, сайт лежит, клиенты жалуются.
  • Используйте кнопки действий внизу экрана — это ваши команды в терминале. Исследуйте систему, найдите причину и почините сервер.
  • Следите за SLA-баром — он тикает вниз. Если дойдёт до 0% — вы проиграли.
  • Каждое действие стоит очков. Старайтесь решить проблему быстро и с минимумом шагов.
  • Подсказки доступны, но за них тоже снимаются очки (-10).
EASY

💽 #0: Disk Full

Диск переполнен, приложение отдаёт 500. Найдите причину и освободите место.

EASY

🛡️ #1: DOS Attack

Сервер под DOS-атакой. Найдите и заблокируйте атакующего.

MEDIUM

💾 #2: Out of Memory?

Приложение не пишет данные. Ошибка ENOMEM, но всё не так просто...

HARD

🔐 #3: Permission Denied

Сервис не стартует после деплоя. Permission denied — но причин несколько...

HARD

🌐 #4: Network Unreachable

Сервер не может достучаться до новой БД. Диагностируйте сеть и восстановите связность.

VERY HARD

🕵️ #5: Cryptojacking

CPU 100%, сайт лежит. Сервер скомпрометирован — найдите и обезвредьте угрозу.