Skip to main content

Site Reliability Engineering (SRE) CheatSheet

  • SLO, SLI, SLA, Error Budget
  • Observability
  • HA, Reliability
  • Automation, Toil
  • RTO, RPO

RPO, RTO

  • RPO - Recovery Point Objective = DATA LOSS - Время - сколько информации можно потерять при Disaster. Например: последние 2 часа
  • RTO - Recovery Time Objective = DOWNTIME - Время - сколько время возьмет восстановить работоспособность системы при Disater. Например: 12 часов.

img

Google SRE