Nagios

Nagios 仍會在計劃的停機時間內發送服務通知

  • July 18, 2016

我的三台伺服器從周五 21:50 到週六 5:30 出現停機。所以我在 timeperiod.cfg 中配置了以下時間段:

define timeperiod{
       timeperiod_name 24x7_without_exclude_hours_for_AZE
       alias           24x7 without 21:50 for friday to 5:30 for saturday
       sunday          00:00-24:00
       monday          00:00-24:00
       tuesday         00:00-24:00
       wednesday       00:00-24:00
       thursday        00:00-24:00
       friday          00:00-21:50
       saturday        05:30-24:00
       }

然後在 template.cfg 文件中,我為這 3 個伺服器創建一個:

define host{
       name                    windows-server-AZE  ; The name of this host template
       use                     generic-host    ; Inherit default values from the gene$
       check_period            24x7_without_exclude_hours_for_AZE            ; By def$
       check_interval          5               ; Actively check the server every 5 mi$
       retry_interval          1               ; Schedule host check retries at 1 min$
       max_check_attempts      10              ; Check each server 10 times (max)
       check_command           check-host-alive        ; Default command to check if $
       notification_period     24x7_without_exclude_hours_for_AZE            ; Send n$
       notification_interval   1440            ; Resend notifications every 24 hours
       notification_options    d,r             ; Only send notifications for specific$
       contact_groups          admins          ; Notifications get sent to the admins$
       hostgroups              windows-servers ; Host groups that Windows servers sho$
       register                0               ; DONT REGISTER THIS - ITS JUST A TEMP$
}

最後在我設置的這 3 台伺服器配置上:

define host{
       use             windows-server-AZE  ; Inherit default values fro$
       host_name       ServerAZE1       ; The name we're giving to t$
       alias           Server AZE 1       ; A longer name associated $
       address         XXX.XXX.XXX.XXX    ; IP address of the host
       }

但是每個星期五的 22:00 我都會收到很多郵件,比如說伺服器 AZE 1 CPU Load is CRITICAL 因為伺服器無法通過其 IP 和埠訪問。

難道我做錯了什麼 ?

首先請注意,*_period 更改與 Nagios 中的“計劃停機時間”不同。

您的問題是您只在主機上設置了 *_period ,而不是在服務上。

因此,您的主機檢查不會在排除的時間執行和通知,但所有服務仍將在預設時間段內執行。

引用自:https://serverfault.com/questions/790424