Zabbix

Zabbix“應用程序”監控 - 如何檢測“掛起”的凍結應用程序

  • April 21, 2011

我在 Ubuntu 上安裝了 Zabbix 伺服器……我在我的 Windows 伺服器上安裝了一個代理。Template_Windows 創造了奇蹟,並為我提供了我樂於使用的各種統計數據……

問題是我正在嘗試監視應用程序。不是服務或網站。一個應用程序。

我有一個喜歡意外崩潰的應用程序。我希望能夠獲得“程序沒有響應”警報(然後將其匯集到電子郵件/簡訊/報告中)。

我有另一台帶有應用程序的伺服器,我想監控統計資訊(CPU 使用率等)。

我看到瞭如何監控服務……但這些不是服務。它們是在“使用者”登錄時執行的應用程序。我找不到關於如何設置這樣的東西的好教程。

編輯:做進一步的研究和修修補補……問題正在變成:不管方法如何,我如何檢測應用程序被凍結/掛起/沒有響應?

  • 使用 Proc_Counter 並檢測是否存在零活動,例如… 15 秒?
  • 使用 perf_info 指標?我似乎沒有看到任何表明掛起程序的內容,但我能找到的唯一手冊頁是 1.4,目前的 Zabbix 是 1.8.4。
  • 監控/測試應用程序的VBScript、命令行測試等,其輸出可通過使用者參數跟踪?

我似乎無法得到一些工作。一旦我可以驗證掛起的程序,我就可以通過任務終止/重新啟動、電子郵件責任方等進行響應……但我似乎無法找到一種優雅的方式來檢測掛起的程序/應用程序。

我花了很長時間才開始simple-checks工作。我還沒有嘗試過應用程序。

這裡的第二個文章有幫助嗎?http://www.zabbix.com/forum/showthread.php?t=18206

你可以去很多方向。

可能最簡單的兩個方法是建構一個使用者參數,該參數在客戶端系統上執行腳本以檢查應用程序的執行狀況。但是,如果執行時間超過 30 秒,那麼您很可能最好通過設置一個腳本來為您提供最佳服務,然後使用 zabbix-sender 將健康數據推送到 Zabbix。另一方面,您可以做很多事情,可能最簡單的事情之一就是觸發 nodata() 和 last()=errorvalue 的組合。如果您有 cron 發送數據,則 nodata 檢查效果最好,因為檢查的時間不受 Zabbix 控制。

在 Zabbix 論壇中已經對此進行了多次討論。

http://www.zabbix.com/forum

引用自:https://serverfault.com/questions/259735