Ssh

為 Nagios 測試設置超時時遇到問題

  • April 22, 2011

我讓 Nagios 監視另一台伺服器上的 Oracle 安裝。有時一個特定的測試(檢查 oracle 表空間可以分配下一個範圍)會失敗,並顯示“CRITICAL - 外掛在 10 秒後超時”。

我想做的第一件事是弄清楚實際需要多長時間才能完成。如果是11秒,也許我不在乎,我只是想將超時設置高一點。

我嘗試為 check_by_ssh 設置超時,用於執行實際命令,如下所示:

define command {
 command_name    check_ssh_oracle_health
 command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C 
     "/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment 
     ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1 
     --connect=nagios/<pwd>@<SID> --timeout=15"
}

這沒有效果;測試仍然出錯,並且仍然說它在 10 秒後發生(是的,我確實重新啟動了 Nagios :)。

我能看到的唯一設置超時的地方是 nagios.cfg;這似乎太高級了(它會影響所有測試),此外,目前沒有一個設置為 10 秒,所以我懷疑這是正確的地方。

任何指針?

我認為那是check_by_ssh超時(10 秒是此檢查的預設超時),而不是check_oracle_health它的內部。嘗試將超時設置check_by_ssh為更高的值,看看它是否仍然發生。

希望這可以幫助!

引用自:https://serverfault.com/questions/259856