когда звенит колокол

Emergency playbook

Что делать при сломанной оплате, утечке данных, массовой ошибке писем, downtime, плохом deploy или опасном контенте.

В emergency важны не красивые объяснения, а порядок: остановить вред, понять масштаб, сообщить честно, откатить, записать урок.

owner

Stop harm

Pause broken flow, hide unsafe copy, disable bad experiment or rollback deploy.

Не продолжать принимать платежи через сломанный flow.

owner

Communicate

Tell affected users what is known, what is being checked and what they should do.

Не обещать детали, которые ещё не проверены.

technical owner

Learn

After fix, write cause, scope, fix, prevention and monitoring rule.

Не закрывать incident без prevention note.

First 15 minutes

Не искать виноватого. Сначала остановить ущерб.

  • Name incident owner.
  • Pause affected flow or rollback if needed.
  • Open incident log with facts only.

First hour

После остановки ущерба определить масштаб и клиентское сообщение.

  • List affected routes/users/payments/emails if known.
  • Draft customer/support response.
  • Decide refund, resend, rollback or maintenance banner.

Aftercare

Инцидент оставляет не только исправление, но и защитный след.

  • Write prevention rule.
  • Add monitoring signal or checklist item.
  • Update support macro if customers were affected.

checklist

  • Incident owner named.
  • Affected flow paused or verified safe.
  • Customer message is factual and not defensive.
  • Prevention note written.

handoff

  • Emergency handoff includes timeline, impact, current state, next decision and owner.

красные флаги

  • Data exposure suspected.
  • Payments continue while checkout is broken.
  • Mass email went to wrong audience.
  • Unsafe content is still public after report.

связанные двери