Site Reliability Engineering (SRE) CheatSheet
- SLO, SLI, SLA, Error Budget
- Observability
- HA, Reliability
- Automation, Toil
- RTO, RPO
RPO, RTO
- RPO - Recovery Point Objective = DATA LOSS - Время - сколько информации можно потерять при Disaster. Например: последние 2 часа
- RTO - Recovery Time Objective = DOWNTIME - Время - сколько время возьмет восстановить работоспособность системы при Disater. Например: 12 часов.