Monitoring

Nagios:關閉關閉主機上的服務檢查/顯示

  • June 4, 2014

我想以這樣一種方式調整 nagios,以使任何關閉節點的所有檢查都停止(服務未顯示或顯示為未知)。換句話說,我只想看到一個停機主機警報,而不是 1(停機)+ n(每個服務 1)。請注意,我對服務顯示/狀態感興趣,而不僅僅是關閉通知。

基本原理:我們使用 nagios firefox/chrome 外掛來監控狀態,而 nagios 的行為過於嘈雜,給出這樣的讀數(因為每個節點都有 20 個服務):

3 down, 1 unreachable, 4 warnings, 87 critical

這意味著 up 節點上的 7 個關鍵服務(問題出在服務上)被淹沒在一組紅色服務中,這些服務之所以關鍵,是因為它們位於關閉/無法訪問的節點上。我更願意看到的是:

3 down, 1 unreachable, 80 unknown, 4 warnings, 7 critical

甚至

3 down, 1 unreachable, 4 warnings, 7 critical

我查看了服務依賴項,但沒有很好的描述方式:“使活動主機上的所有服務都依賴於主機檢查的狀態”。

我發現 這裡討論的問題,其中一位參與者認為這是一個 nagios 錯誤,而這裡一位參與者認為它是“按設計的”。

事實上,我只對效果感興趣,更不用說設計理念了。請注意,此 nagios 正在檢查數百個節點,因此解決方案的可維護性也很重要。

TIA 和歡呼。

您可以在使用 Nagstamon 的最新版本 (0.9.11) 時隱藏它,它是 Nagios/Icinga 的桌面(托盤)狀態監視器:http: //nagstamon.ifw-dresden.de/

在此處輸入圖像描述

您可以通過在狀態 CGI 視圖中應用過濾器來執行此操作…

Chrome/FF 外掛只是從 CGI 中抓取數據,因此如果您將這些相同的過濾器添加到外掛正在查詢的狀態 URL,您可以控制它顯示的內容。

例如,如果您只希望它看到主機:status.cgi?hostgroup=all&style=hostdetail

對於已啟動的主機上的問題服務,僅:status.cgi?host=all&servicestatustypes=28&hoststatustypes=2

有關要使用的特定值的更多資訊,請參閱有關過濾器的部落格文章。(它們是位欄位。)

編輯:這正是 nagstamon 在您選中這些框時所做的事情,順便說一句。

引用自:https://serverfault.com/questions/601728