Reporting

有哪些工具可用於擷取和報告系統(應用程序、數據庫和系統)指標?

  • June 12, 2009

我正在考慮設置一個工具,用於從各種平台上的多個系統收集使用數據和 KPI。我們希望定期報告有關係統使用情況和執行狀況的關鍵指標。它不需要實時監控每月的性能和使用指標。

輸入的系統將多種多樣,從執行大型 ERP 應用程序的 Solaris 盒子到執行我們內部網的 IIS。我們會同意每個 2-5 kpi,然後編寫某種腳本來從每個系統中提取數據。數據會有所不同,從使用者名的使用情況、應用程序的使用情況到性能數據(例如每個站點的響應時間)。

是否有現成的應用程序用於儲存和報告各種指標?

就我而言,它需要免費便宜,否則我們將自己創建和維護一個小型數據庫。

有許多不同的商業監控工具,HP OpenView Operations 特別是性能監控器會為您的目的而出現,但它們都非常昂貴。我認為你應該首先不要說你想要什麼,而是說你希望實現什麼:“我們希望定期報告有關係統使用情況和健康狀況的關鍵指標”。您是否正在查看您環境中伺服器的硬體執行狀況?HP SIM 或其他基於 SNMP 的工具將適用於此。您是否正在尋找 CPU 使用率、硬碟空間、網路使用率等系統重要統計數據?對於 linux 你想要 sar,collectd。對於 Windows,您可以通過 SNMP 獲得這些統計資訊。

根據您的環境,集中監控應用程序性能和執行狀況而不是底層作業系統可能更合適。CPU、網路尖峰是粗略的衡量標準,在復雜的環境中它不一定是你關心的。首先衡量您的每秒交易量,以便了解您是否有問題需要調查。

查看像 splunk 這樣的日誌監控工具可能是合適的,因為您的系統通常會告訴您是否有問題。同樣,這取決於您真正想要實現的目標。

OVO 可能是可以滿足您需求的工具,但它很昂貴。對於開源工具,請查看 cacti、nagios 和 collectd。

引用自:https://serverfault.com/questions/4446