Munin
延遲 munin 通知
我有一些由 munin 監控的伺服器,並且相當頻繁地,一組單元中的一個在讀取數據時出現瞬時故障。這給了我兩封電子郵件,一封告訴我所有的值都是未知的,第二封在五分鐘後讓我知道一切都很好。
據我所知, munin 正在按此處的設計執行,但我想知道是否有任何方法可以延遲發送一個更新周期的初始“未知”警報,因此不會報告瞬態未知數?我目前的所有設置都是訓練我忽略警告郵件。
如果做不到這一點,有沒有辦法完全禁用發送“未知”警報及其相應的恢復警報?
我並沒有真正使用 Munin,但我看到
unknown_limit
可以為項目/外掛設置一個設置,該設置定義在將值設置為“未知”之前應該發生多少連續不成功的讀數。基於 Munin::LimitsOld 模組,它預設為 3,我認為你應該嘗試設置或增加這個數字。
我在 Munin 1.4.5 上檢查過這個。
我通過讓 munin 通知來實現這一點,不是直接通知最終使用者,而是通過 NSCA 通知 NAGIOS,並讓 NAGIOS 處理通知。這意味著我可以使用 NAGIOS(更複雜)控制通知延遲、頻率、升級等。是的,NAGIOS 僅作為通知引擎就相當重量級,但您也可以將其用於定性(而不是定量)監控。