Http
nagios - 10/20/60 秒後 HTTP CRITICAL 套接字超時
我剛剛在伺服器機器上安裝了 nagios,卻在 HTTP 服務上遇到了嚴重錯誤。
錯誤是
HTTP CRITICAL - Socket timeout after 10 seconds
我搜尋了這個錯誤並得到了以
check_http
更長的超時時間執行的建議。所以我在“check_http”命令旁邊附加-t 20
了文件。commands.cfg
重新啟動 nagios 但我仍然收到錯誤(對於新的超時)。然後又找了一些。這個錯誤似乎很常見,所以我開始認為我可能還有其他問題。
我嘗試自己執行 check_http:
root@srv$ /usr/libexec/nagios/check_http -H localhost -N -p 80 -t 1 HTTP OK: HTTP/1.1 200 OK - 846 bytes in 0.003 second response time |time=0.003080s;;;0.000000 size=846B;;;0
響應似乎還不錯,但我對http知之甚少。
有什麼線索嗎?
編輯: 的命令定義
check_http
,取自 /etc/nagios/objects/commands.cfg 是# 'check_http' command definition define command{ command_name check_http command_line $USER1$/check_http -I $HOSTADDRESS$ $ARG1$ }
我不知道如何檢查變數的值是什麼 $ HOSTADDRESS $ 更重要的是 $ ARG1 $ .
那麼服務的定義是
define service{ use local-service ; Name of service template to use host_name localhost service_description HTTP check_command check_http notifications_enabled 1 }
發行版是 slackware 14.0 64bit。
您的檢查命令與您的手動測試不匹配。
如果您希望 Nagios 以與手動測試相同的方式執行檢查,由於您的檢查命令的定義方式,您的服務定義必須是這樣的:
define service{ use local-service host_name localhost service_description HTTP check_command check_http!-N -p 80 -t 1 notifications_enabled 1 }
…而且您還必須將“localhost”作為該主機的地址。
(但 1 秒的超時有點短。)