Nagios

Nagios CHECK_NRPE:從守護程序接收數據時出錯。RHEL 6

  • March 21, 2016

所以我試圖在 Red Hat 伺服器上設置 Nagios check_load 服務。我按照 Red Hat 的文件安裝了 NRPE 客戶端:https ://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux_OpenStack_Platform/3/html/Installation_and_Configuration_Guide/Installing_and_Configuring_NRPE.html

在 Nagios GUI 上,我得到了這個:

CHECK_NRPE: Error receiving data from daemon.

但是當我登錄到 Nagios 伺服器進行調試時,看起來我可以從終端正常執行:

root@portalmon:/Nagios# /usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
OK - load average: 0.15, 0.10, 0.04|load1=0.150;15.000;30.000;0; load5=0.100;10.000;25.000;0; load15=0.040;5.000;20.000;0;

所以我認為這不是權限問題。我認為這是某種路徑問題,但我無法弄清楚為什麼這不起作用。有人可以幫忙嗎?

這是我的服務說明:

define service{
 use                 dev-service
 host_name           [DEV] Luminis Admin DEV Portal
 service_description CPU-Load
 check_command       check_nrpe!"check_load"
}

我想知道當我執行上面的終端命令時是否呼叫了相同的服務。

編輯:我發現了這個問題。現在正在研究解決方案。我將 Nagios 更改為調試模式,通過查看 /usr/local/nagios/var/nagios.debug 我意識到正在執行的命令是

/usr/local/nagios/libexec/check_nrpe -n -t 60 -H <hostname> -c check_load

代替

/usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30

所以有些東西附加了“-n”,它導致了問題。第二個命令返回我想要的,但第一個返回

CHECK_NRPE: Error receiving data from daemon.

編輯2:想通了,但我沒有足夠的聲譽將其作為有效答案送出,所以下面是我輸入的內容。

我能夠解決我的問題。這就是我所做的。

  1. 在 Nagios.cfg 中,我打開了調試模式,找到了調試文件的位置。
  2. 在跟踪調試日誌時複製了該問題。發現 Nagios 正在執行的命令與我的預期不同。它附加了無 SSL 標誌 (-n)。
  3. 在 commands.cfg 中,我搜尋了 check_nrpe。發現它正在執行帶有-n的命令。還有另一個名為 check_secure_nrpe 的命令在沒有 -n 標誌的情況下執行 check_nrpe。
  4. 編輯了我的服務描述以使用 check_secure_nrpe 而不是 check_nrpe。
  5. 重新啟動 Nagios。

該服務現在按預期工作。

我能夠解決我的問題。這就是我所做的。

  1. 在 Nagios.cfg 中,我打開了調試模式,找到了調試文件的位置。
  2. 在跟踪調試日誌時複製了該問題。發現 Nagios 正在執行的命令與我的預期不同。它附加了無 SSL 標誌 (-n)。
  3. 在 commands.cfg 中,我搜尋了 check_nrpe。發現它正在執行帶有-n的命令。還有另一個名為 check_secure_nrpe 的命令在沒有 -n 標誌的情況下執行 check_nrpe。
  4. 編輯了我的服務描述以使用 check_secure_nrpe 而不是 check_nrpe。
  5. 重新啟動 Nagios。

該服務現在按預期工作。

引用自:https://serverfault.com/questions/616751