Bài viết này tóm tắt 2 chương đầu tiên của sách On-Call In Action, trình bày triết lý SRE, vai trò On-Call và các bước trong vòng đời quản lý sự cố, kèm checklist & mô hình.
Bài viết này tóm tắt chương 3 từ sách On-Call In Action, trình bày nguyên tắc thiết kế alert hiệu quả, phân loại alert, tránh nhiễu, kèm checklist và mô hình minh hoạ.
Bài viết này hướng dẫn bạn từng bước đặt script cảnh báo vào thư mục /etc/profile.d để phát hiện đăng nhập shell trên Linux, và gửi cảnh báo về Telegram.
Bài viết này trình bày quy trình MLOps chi tiết từ thu thập dữ liệu, huấn luyện mô hình, kiểm thử, CI/CD đến giám sát và cập nhật mô hình ML trong thực tế.