Debian

Nagios 警告 CHECK_NRPE: Socket timeout after 30 seconds but it is running

  • April 18, 2020

我的伺服器上有 nagios,它正在提醒我

CHECK_NRPE: Socket timeout after 30 seconds. 

但我的服務正在執行:

● nagios-nrpe-server.service - Nagios Remote Plugin Executor
  Loaded: loaded (/lib/systemd/system/nagios-nrpe-server.service; enabled; vendor preset: enabled)
  Active: active (running) since Sat 2020-04-18 00:31:56 CEST; 6min ago
    Docs: http://www.nagios.org/documentation
 Process: 4841 ExecStopPost=/bin/rm -f /var/run/nagios/nrpe.pid (code=exited, status=0/SUCCESS)
Main PID: 4845 (nrpe)
   Tasks: 5 (limit: 4915)
  CGroup: /system.slice/nagios-nrpe-server.service
          ├─4845 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f
          ├─6346 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f
          ├─6347 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f
          ├─6348 sh -c /usr/lib/nagios/plugins/check_disk -e -w 5% -W 3% -c 2% -K 2% -X tmpfs
          └─6349 /usr/lib/nagios/plugins/check_disk -e -w 5% -W 3% -c 2% -K 2% -X tmpfs

我試圖殺死它,重新啟動它,重新啟動正在處理所有警報的 nagios 伺服器,但沒有任何效果。它從無到有,並且不知道有什麼問題,因為所有其他 nagios 的伺服器都在工作。

超時來自客戶端外掛check_nrpe,30 秒後終止連接。

我認為 NRPE 伺服器中沒有適當的超時,但大多數外掛應該實現超時行為。

引用自:https://serverfault.com/questions/1012862