Performance

Nagios 遠端監控:NRPE 對比SSH

  • September 24, 2015

我們使用 Nagios 來監控很多(~130)台伺服器。我們監控每台伺服器上的 CPU、磁碟、RAM 和其他一些東西。我一直使用 SSH 來執行遠端命令,純粹是因為它幾乎不需要在遠端伺服器上進行額外的配置,只需安裝 nagios-plugins,創建 nagios 使用者並添加 SSH 密鑰,所有這些我都已自動完成一個外殼腳本。我從未真正考慮過在 NRPE 上使用 SSH 對性能的影響。

我不太擔心 Nagios 伺服器上的負載問題(它的功能可能超出了規格,它從未超過 10% 的 CPU),但我們每 30 秒執行一次遠端檢查,每台伺服器都有 5 種不同的檢查執行。我認為 SSH 每次檢查都需要更多資源,但有很大的不同嗎?(IE 的差異足以保證切換到 NRPE)。

如果有任何幫助,我們會監控混合的物理伺服器(通常具有 8、12 或 16 個物理核心)和 Amazon EC2 中型/大型實例。

我一直相信 SSH 的管理優勢(我使用push_check)勝過任何額外的負載。現代 CPU 速度如此之快,加密少量字節的成本非常低,因此它歸結為執行兩個程序(SSH 和檢查腳本)與一個(由 NRPE 觸發的檢查腳本)。

對於用解釋語言編寫的檢查腳本,我預計啟動解釋器(Perl、Python、Bash)的成本會超過啟動 SSH 會話的 CPU 成本。鑑於現代 CPU,您的機器更有可能受到磁碟或記憶體的限制,而不是 CPU 的限制。

如果您的 Nagios 機器能夠應付——它必須每秒建立 20 個 SSH 連接——為了方便起見,我會犯錯。

不是你的問題的真正答案,更多的是生命太短,不能擔心它的論點:)

引用自:https://serverfault.com/questions/280205