Nagios
Nagios/Icinga:不要在備用節點上顯示 DRBD 分區的 CRITICAL
我在故障轉移配置中設置了一個起搏器/corosync ha-cluster,具有兩個節點:生產節點和備用節點。有三個 DRBD 分區。到目前為止一切正常。
我在兩個節點上都使用 Nagios NRPE 來監控使用 icinga2 作為報告和視覺化工具的伺服器。現在,由於備用節點上的 DRBD 分區在出現故障轉移開關之前不會掛載,因此我總是會收到以下嚴重警告:
因此,這是一個錯誤警報。我已經偶然發現了 DISABLE_SVC_CHECK 並嘗試實現它,這是一個範例:
echo "[`date +%s`] DISABLE_SVC_CHECK;$host_name;$service_name" >> "/var/run/icinga2/cmd/icinga2.cmd"
是否有一種簡單的方法/最佳實踐可以在 Nagios 或 Icinga2 的備用節點上禁用對 DRBD 的檢查?當然,我希望此檢查在故障轉移後對備用伺服器生效。
我建議不要直接在主機上監控它。在我們的環境中,我們使用 Pacemaker 來自動化故障轉移。Pacemaker 為我們做的一件事是在故障轉移時移動 IP 地址。這可確保我們的客戶端始終指向主節點,並有助於使故障轉移在客戶端看起來是透明的。
對於 Nagios,我們監控每台主機上的大量服務以密切關注,但隨後我們為虛擬/浮動 IP 地址配置了一個額外的“主機”,以監控僅在主伺服器上執行的 DRBD 設備和服務。