Munin
如何使 Munin 的外掛警告之一靜音?
我有一台伺服器同時從各種伺服器執行備份,並收到很多“寫入 IO 等待時間”警告。是否可以在單個主機上消除單個外掛的警告?
我認為是為了
diskstats_latency.avgwrwait
.
你沒有說你是如何獲得 munin 報告的,這使得這個問題很難回答。我假設您讓它直接發送電子郵件,其中包含以下內容
munin.conf
:contact.dax.command mail -s "Munin notification" dax@example.com
如果是這樣,我知道使單個警報靜音的唯一方法是通過提高限制來告訴 munin 這不是問題,例如
[host.example.com] diskstats_latency.avgwrwait.warning 100000000000 diskstats_latency.avgwrwait.critical 200000000000
潛在的問題是 munin 非常擅長定量監控,但在通知處理方面卻很差。它缺乏控制來暫時使特定警報靜音、僅在一天中的特定時間通過特定渠道通知、安排停機時間和/或在問題繼續存在時上報給更高級別的聯繫人。我認識的大多數執行 munin 的人(包括我)都將它報告給 NAGIOS,它有一個非常複雜的通知引擎,可以完成上述所有操作。
如果您有此設置,您可以在 NAGIOS 中確認錯誤(靜默通知,直到下一次恢復正常),或者讓您的備份腳本為服務安排一段停機時間,持續大約備份的長度,甚至通過禁用該服務的通知來啟動腳本,並在完成時重新啟用它們。