Munin

延遲 munin 通知

  • March 21, 2014

我有一些由 munin 監控的伺服器,並且相當頻繁地,一組單元中的一個在讀取數據時出現瞬時故障。這給了我兩封電子郵件,一封告訴我所有的值都是未知的,第二封在五分鐘後讓我知道一切都很好。

據我所知, munin 正在按此處的設計執行,但我想知道是否有任何方法可以延遲發送一個更新周期的初始“未知”警報,因此不會報告瞬態未知數?我目前的所有設置都是訓練我忽略警告郵件。

如果做不到這一點,有沒有辦法完全禁用發送“未知”警報及其相應的恢復警報?

我並沒有真正使用 Munin,但我看到unknown_limit可以為項目/外掛設置一個設置,該設置定義在將值設置為“未知”之前應該發生多少連續不成功的讀數。

基於 Munin::LimitsOld 模組,它預設為 3,我認為你應該嘗試設置或增加這個數字。

我在 Munin 1.4.5 上檢查過這個。

我通過讓 munin 通知來實現這一點,不是直接通知最終使用者,而是通過 NSCA 通知 NAGIOS,並讓 NAGIOS 處理通知。這意味著我可以使用 NAGIOS(更複雜)控制通知延遲、頻率、升級等。是的,NAGIOS 僅作為通知引擎就相當重量級,但您也可以將其用於定性(而不是定量)監控。

引用自:https://serverfault.com/questions/564074