Blog chia sẻ về công nghệ ...
Published on

[Google-SRE-bản dịch tiếng việt]-Eliminating Toil trong SRE - Giảm bớt công việc lặp lại

Authors

📑 Mục Lục

  1. Toil là gì?
  2. Tại sao cần giảm Toil?
  3. Phân biệt các loại công việc
  4. Toil có luôn xấu không?
  5. Kết luận

🔧 Toil là gì?

Trong SRE, toil được định nghĩa là loại công việc thủ công, lặp lại, có thể tự động hóa, có tính chiến thuật, không để lại giá trị lâu dài, và tăng tuyến tính theo quy mô dịch vụ.

Một số đặc điểm của toil:

  • Thủ công: ví dụ bạn phải chạy một script bằng tay.
  • Lặp lại: làm đi làm lại các task giống nhau.
  • Có thể tự động hóa: máy móc hoàn toàn có thể thay thế con người.
  • Không có giá trị lâu dài: sau khi làm xong, hệ thống không tốt hơn.
  • Tăng theo quy mô: khi hệ thống tăng x2, bạn phải làm x2 lượng công việc.

📉 Tại sao cần giảm Toil?

Google SRE đặt mục tiêu không dành quá 50% thời gian cho toil. Lý do:

  • Toil mở rộng không kiểm soát: có thể chiếm hết 100% thời gian nếu không cẩn thận.
  • Ảnh hưởng đến hiệu suất nhóm: mất thời gian để tạo ra tính năng mới, tối ưu hiệu năng, hoặc cải thiện hệ thống.
  • Ảnh hưởng tuyển dụng: nếu một nhóm SRE làm quá nhiều toil, họ không còn là kỹ sư, mà là một nhóm vận hành thuần túy.
  • Ảnh hưởng tinh thần: gây chán nản, dễ burnout, giảm sự sáng tạo.

⚙️ Phân biệt các loại công việc

Loại công việcĐặc điểm chínhVí dụ
EngineeringCó sáng tạo, chiến lược, có giá trị lâu dàiViết automation, cải tiến hệ thống
Systems EngineeringCấu hình, tư vấn kiến trúc, tài liệu hóaTuning OS, viết tài liệu hệ thống
ToilLặp lại, thủ công, có thể tự động hóaXử lý alert lặp lại, push code thủ công
OverheadHành chính, không liên quan vận hànhHọp, review, viết snippet

🤔 Toil có luôn xấu không?

Không phải lúc nào toil cũng xấu:

  • Toil nhẹ có thể giúp bạn "nghỉ ngơi" giữa các dự án lớn.
  • Một số người thích toil nhẹ nhàng, dễ đạt thành quả.
  • Tuy nhiên toil trở thành vấn đề khi chiếm quá nhiều thời gian hoặc khiến bạn không còn là một kỹ sư đúng nghĩa.

✅ Kết luận

Giảm toil là trách nhiệm tập thể. Mỗi tuần nếu bạn loại bỏ được một chút toil, thì toàn hệ thống sẽ ngày càng khỏe mạnh. Hãy tập trung vào việc tự động hóa, thiết kế lại quy trình, dọn dẹp hệ thống, và đưa ra các công cụ chung để cả nhóm cùng hưởng lợi.

👉 Invent more, and toil less.