Performance-Monitoring

Performance Co-Pilot 能否用作獨立的 NMS 解決方案?

  • September 16, 2020

我想知道 Performance Co-Pilot (PCP) 是否設置為具有 NMS 應用程序的所有功能,即。Nagios 或 Zabbix。我使用它從主機中提取指標並在儀表板上繪製值,但我想知道如何使用它來監控數百台伺服器並檢測故障。PCP 文件描述了所有的模組和守護程序,但我找不到太多關於如何將它們組合在一起的資訊。性能指標推理引擎 (PMIE) 可以評估邏輯表達式並發出警報,或者 PCP 管理器 (pmmgr) 可用於從多個主機收集數據。因此,如果我想使用 PMIE 進行故障檢測和警報,它應該在每個受監控的主機上執行還是在中央 NMS 伺服器上執行?它是只從 PCP 日誌中讀取指標,還是可以通過 WebAPI 連接到受監控的主機?如果我想在 InfluxDB 或 ElasticSearch 中儲存指標,我應該讓導出器(pcp2influxdb 或 pcp2elasticsearch)在受監控的主機上執行,還是先在一個地方收集 PCP 日誌並從那裡導出?如果 pmmgr 從多個主機收集指標需要每個目標主機有一個 pmlogger 實例,它是否可以在大型環境中的一台伺服器上高效工作,即。1000 台受監控的伺服器?

一篇文章中有很多問題,但歸結為一個問題:PCP 可以是 NMS 嗎?

答案是不。PCP 套件包括一些用於繪製以本機日誌格式儲存的指標的圖形工具,但沒有其他工具具有管理庫存、警報、通知等所需的功能。可以將 PCP 與其他功能齊全的 NMS 應用程序集成包括 Prometheus,因此這是目前將其作為監控系統一部分的唯一方法。

引用自:https://serverfault.com/questions/1020829