Monitoring

具有 API 功能的網路監控工具

  • June 8, 2011

我們使用 ks-soft 的 Advanced Hostmonitor 包來監控我們網路上的大約 2000 個項目。我們認為它很棒,支持它的小伙子很棒,產品快速、穩定和成熟,但我覺得隨著我們公司的成長,它開始在與我們的後台管理系統集成方面出現一些摩擦點。

我們想做的一件事是能夠通過 API 向我們使用的任何監控工具添加新測試。例如,當伺服器訂單來自我們的零售界面時,伺服器會自動建構,作為自動化建構過程的一部分,我們希望自動向網路監控系統添加新測試。

Hostmonitor 通過名為 HM Script 的功能對此提供了一些支持,但我們開始遇到一些減速帶 -

  1. 我們無法添加新的運營商/使用者
  2. 我們不能定義新的“動作配置文件”——這些是當測試好壞時要採取的動作。

我們喜歡 hostmonitor的是Action Profiles。例如,如果一個 Windows IIS 機器壞了,我們針對壞測試的操作配置文件會執行以下操作:

  • 再次檢查主機(一次)
  • 再等待 30 秒,然後再次測試
  • 嘗試在遠端機器上重新啟動應用程序池(最多兩次)
  • 向 ops 發送有關重啟失敗的電子郵件
  • 嘗試在遠端電腦上重新啟動 IIS(最多四次)
  • 頁面值班管理員(最多 5 次 - 在值班管理員確認警報後停止)
  • 頁面備份值班管理員(5 次 - 值班管理員確認警報後停止)

我開始環顧其他網路監控工具,我正在尋找:

  1. 一個全面的 API,能夠添加/刪除/控制測試/測試“動作配置文件”/操作符(不僅僅是外掛,我們需要控制和管理界面)
  2. 擁有非常詳細的操作/升級配置文件的能力(並通過 API 定義這些配置文件)

我查看了 Nagios 和 Icinga,但我似乎無法從他們的文件中收集到我們是否可以擁有這些功能,或者如果可以,實現/定制將涉及多少工作。

任何人都可以提供任何建議、指導或經驗嗎?

Icinga 做得很好(我更喜歡它而不是 Nagios,因為它有一個可用於獲取數據的 API,並且與 Nagios 外掛 100% 兼容)。

有一個關於 Nagios VS Icinga 的影片很好地描述了它:Youtube(它是由 Icinga 製作的,所以,請謹慎使用)

您可以使用 Icinga 向某人發送電子郵件/發送簡訊,甚至執行腳本(因此,重新啟動服務,重新啟動,…) 範例:連結(它是一個 nagios 連結,但它是相同的交易)。

我唯一不確定的是按時間順序執行命令。

為了使配置更容易,我們使用NConf。它為主機、服務……提供了一個 API(不用於使用者管理)。

引用自:https://serverfault.com/questions/246902