Skip to main content

Chapter 5. Eliminating Toil

If a human operator needs to touch your system during normal operations, you have a bug (The definition of normal changes as your systems grow.)

SRE - хотят заниматься инженерной, а не операционной работой.

Toil Defined

Toil (рутина) - это ручная, однообразная, поддающаяся автоматизации оперативная работа, связанная с поддержкой работающего сервиса. Ее результаты не имеют ценности в перспективе, а трудоемкость растет линейно по мере роста сервиса.

SRE должны тратить не более 50% на рутину, остальное время на инженерные задачи.

What Qualifies as Engineering?

Инженерная работа по своей природе требует участие человека, она творческая и инновационная. С помощью такой работы инженеры могут справиться с масштабными сервисами.

Key Insights

Symlinks
  • on call duty - (1)
note

If we all commit to eliminate a bit of toil each week with some good engineering, we’ll steadily clean up our services, and we can shift our collective efforts to engineering for scale, architecting the next generation of services, and building cross-SRE tool‐ chains. Let’s invent more, and toil less.