Http

nagios - 10/20/60 秒後 HTTP CRITICAL 套接字超時

  • January 12, 2014

我剛剛在伺服器機器上安裝了 nagios,卻在 HTTP 服務上遇到了嚴重錯誤。

錯誤是

HTTP CRITICAL - Socket timeout after 10 seconds 

搜尋了這個錯誤並得到了以check_http更長的超時時間執行的建議。所以我在“check_http”命令旁邊附加-t 20了文件。commands.cfg重新啟動 nagios 但我仍然收到錯誤(對於新的超時)。

然後又找了一些。這個錯誤似乎很常見,所以我開始認為我可能還有其他問題。

我嘗試自己執行 check_http:

root@srv$ /usr/libexec/nagios/check_http -H localhost -N -p 80 -t 1

HTTP OK: HTTP/1.1 200 OK - 846 bytes in 0.003 second response time |time=0.003080s;;;0.000000 size=846B;;;0

響應似乎還不錯,但我對http知之甚少。

有什麼線索嗎?

編輯: 的命令定義check_http,取自 /etc/nagios/objects/commands.cfg 是

# 'check_http' command definition
define command{
       command_name    check_http
       command_line    $USER1$/check_http -I $HOSTADDRESS$ $ARG1$
       }

我不知道如何檢查變數的值是什麼 $ HOSTADDRESS $ 更重要的是 $ ARG1 $ .

那麼服務的定義是

define service{
   use                             local-service         ; Name of service template to use
   host_name                       localhost
   service_description             HTTP
   check_command                   check_http
   notifications_enabled           1
   }

發行版是 slackware 14.0 64bit。

您的檢查命令與您的手動測試不匹配。

如果您希望 Nagios 以與手動測試相同的方式執行檢查,由於您的檢查命令的定義方式,您的服務定義必須是這樣的:

define service{
   use                             local-service
   host_name                       localhost
   service_description             HTTP
   check_command                   check_http!-N -p 80 -t 1
   notifications_enabled           1
}

…而且您還必須將“localhost”作為該主機的地址。

(但 1 秒的超時有點短。)

引用自:https://serverfault.com/questions/529342