Outage

作為運營團隊,您使用什麼工具來衡量您的 MTTR?

  • April 29, 2022

你會測量它嗎?

我的問題是,當出現中斷警報時,首先創建 JIRA 票證感覺很浪費時間,所以我立即開始解決它。此外,一些中斷首先通過變通方法解決,然後重新訪問以正確解決它們。

“我的問題是,當出現中斷警報時,首先創建 JIRA 票證感覺很浪費時間”

這當然很容易解決,大多數警報系統可以同時發出多個警報,其中一個警報可以是自動創建 Jira 票證。

然後,關閉該 Jira 票證的一部分可以是記錄(以適合您的任何方式/系統)您同意作為修復時間的管理任務。

(已經暗示但讓我明確聲明:您的票務系統跟踪的票證解決時間與修復時間不同。)

當故障單解決時間很重要並且本身是性能指標時,您可能希望在故障解決後立即關閉自動生成的故障故障單。

當您開始根本原因分析 (RCA) 調查時,請使用相關但新的問題調查票 #XYZ(它具有不同的性能標準,並且報告的方式與關於中斷的票證不同。)。

根據 RCA 結果,您可能會開始著手製定永久性修復/緩解措施,然後再以不同的方式跟踪這些措施,具體取決於需要完成的工作。

引用自:https://serverfault.com/questions/1099754