Nagios
Nagios CHECK_NRPE:從守護程序接收數據時出錯。RHEL 6
所以我試圖在 Red Hat 伺服器上設置 Nagios check_load 服務。我按照 Red Hat 的文件安裝了 NRPE 客戶端:https ://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux_OpenStack_Platform/3/html/Installation_and_Configuration_Guide/Installing_and_Configuring_NRPE.html
在 Nagios GUI 上,我得到了這個:
CHECK_NRPE: Error receiving data from daemon.
但是當我登錄到 Nagios 伺服器進行調試時,看起來我可以從終端正常執行:
root@portalmon:/Nagios# /usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30 OK - load average: 0.15, 0.10, 0.04|load1=0.150;15.000;30.000;0; load5=0.100;10.000;25.000;0; load15=0.040;5.000;20.000;0;
所以我認為這不是權限問題。我認為這是某種路徑問題,但我無法弄清楚為什麼這不起作用。有人可以幫忙嗎?
這是我的服務說明:
define service{ use dev-service host_name [DEV] Luminis Admin DEV Portal service_description CPU-Load check_command check_nrpe!"check_load" }
我想知道當我執行上面的終端命令時是否呼叫了相同的服務。
編輯:我發現了這個問題。現在正在研究解決方案。我將 Nagios 更改為調試模式,通過查看 /usr/local/nagios/var/nagios.debug 我意識到正在執行的命令是
/usr/local/nagios/libexec/check_nrpe -n -t 60 -H <hostname> -c check_load
代替
/usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
所以有些東西附加了“-n”,它導致了問題。第二個命令返回我想要的,但第一個返回
CHECK_NRPE: Error receiving data from daemon.
編輯2:想通了,但我沒有足夠的聲譽將其作為有效答案送出,所以下面是我輸入的內容。
我能夠解決我的問題。這就是我所做的。
- 在 Nagios.cfg 中,我打開了調試模式,找到了調試文件的位置。
- 在跟踪調試日誌時複製了該問題。發現 Nagios 正在執行的命令與我的預期不同。它附加了無 SSL 標誌 (-n)。
- 在 commands.cfg 中,我搜尋了 check_nrpe。發現它正在執行帶有-n的命令。還有另一個名為 check_secure_nrpe 的命令在沒有 -n 標誌的情況下執行 check_nrpe。
- 編輯了我的服務描述以使用 check_secure_nrpe 而不是 check_nrpe。
- 重新啟動 Nagios。
該服務現在按預期工作。
我能夠解決我的問題。這就是我所做的。
- 在 Nagios.cfg 中,我打開了調試模式,找到了調試文件的位置。
- 在跟踪調試日誌時複製了該問題。發現 Nagios 正在執行的命令與我的預期不同。它附加了無 SSL 標誌 (-n)。
- 在 commands.cfg 中,我搜尋了 check_nrpe。發現它正在執行帶有-n的命令。還有另一個名為 check_secure_nrpe 的命令在沒有 -n 標誌的情況下執行 check_nrpe。
- 編輯了我的服務描述以使用 check_secure_nrpe 而不是 check_nrpe。
- 重新啟動 Nagios。
該服務現在按預期工作。