Chapter 5. Eliminating Toil
If a human operator needs to touch your system during normal operations, you have a bug (The definition of normal changes as your systems grow.)
SRE - хотят заниматься инженерной, а не операционной работой.
Toil Defined
Toil (рутина) - это ручная, однообразная, поддающаяся автоматизации оперативная работа, связанная с поддержкой работающего сервиса. Ее результаты не имеют ценности в перспективе, а трудоемкость растет линейно по мере роста сервиса.
SRE должны тратить не более 50% на рутину, остальное время на инженерные задачи.
What Qualifies as Engineering?
Инженерная работа по своей природе требует участие человека, она творческая и инновационная. С помощью такой работы инженеры могут справиться с масштабными сервисами.
Key Insights
Symlinks
- on call duty - (1)
note
If we all commit to eliminate a bit of toil each week with some good engineering, we’ll steadily clean up our services, and we can shift our collective efforts to engineering for scale, architecting the next generation of services, and building cross-SRE tool‐ chains. Let’s invent more, and toil less.