Blog chia sẻ về công nghệ ...
Published on

On-Call In Action: Lịch trực bền vững & Tránh Burnout - Phần 7

Authors

🧭 Phần 7: Lịch trực On-call bền vững & Tránh Burnout

⚠️ Vấn đề cần giải quyết

  • Lịch trực không hợp lý → kỹ sư mất ngủ, stress, kiệt sức
  • Dẫn đến turnover cao, mất kiến thức tổ chức
  • Trực đêm, cuối tuần cần được thiết kế & bù đắp xứng đáng

🎯 Mục tiêu lịch trực bền vững

  • Công bằng, minh bạch giữa các thành viên
  • Đảm bảo đủ thời gian hồi phục
  • Giảm thiểu gián đoạn cuộc sống cá nhân
  • Có cơ chế hỗ trợ – backup, trade shift, bồi thường

📅 Các mô hình lịch trực phổ biến

Mô hìnhMô tảPhù hợp với
1 tuần 1 vòngMỗi người trực 1 tuần liên tiếpTeam nhỏ, ít alert
Follow-the-sunTrực theo múi giờ khác nhauTeam đa quốc gia
Primary + SecondaryCó người dự phòng nếu chính không phản hồiTeam lớn, alert nhiều

💡 Nguyên tắc thiết kế lịch trực

  • Tránh trực > 7 ngày liên tục
  • Tránh trực > 2–3 đêm trong tuần
  • Đảm bảo ít nhất 1 ngày không on-call giữa các ca
  • Có công cụ quản lý lịch (PagerDuty, Opsgenie, Google Calendar)

💵 Bù đắp & công nhận

  • Trả lương trực ngoài giờ (compensation on-call)
  • Có ngày nghỉ bù sau khi trực đêm
  • Ghi nhận đóng góp trong đánh giá hiệu suất

😵 Dấu hiệu kiệt sức (burnout)

  • Mất động lực đi làm
  • Dễ cáu gắt, mất tập trung
  • Luôn trong trạng thái cảnh giác cao độ (hyper-vigilance)
  • Mất ngủ, mệt mỏi kéo dài

✅ Checklist lịch trực bền vững

  • Mỗi người có quyền xem & góp ý lịch trực
  • Có chính sách nghỉ sau ca trực đêm
  • Có quy trình chuyển ca rõ ràng
  • Có backup nếu on-call không phản hồi
  • Có cơ chế review độ công bằng hàng quý
  • Có hỗ trợ tâm lý nếu dấu hiệu burnout xuất hiện

📦 Mô hình lịch trực on-call lý tưởng

[Mỗi tuần]
  ├── Mon–Fri: Primary A, Secondary B
  ├── Weekend: Primary B, Secondary A
  └── Trực đêm: Chia đều, không lặp 2 ngày liên tiếp

[Hậu trực]
  └── Ngày nghỉ tự chọn hoặc làm việc nhẹ nhàng

🛠️ Công cụ hỗ trợ

  • PagerDuty, Opsgenie, BetterUptime
  • Google Calendar + Sheet rotation
  • OnCallBot (Slack)
  • Terraform + API On-call để tự động hóa lịch

📌 Kết luận:
Bền vững là yếu tố sống còn cho On-call.
Kỹ sư chỉ có thể phản ứng tốt với sự cố khi được nghỉ ngơi và công nhận đúng mức.

Chương tiếp theo sẽ nói về giao tiếp hiệu quả trong và sau sự cố.