High-Availability
Zabbix Web 界面顯示 Zabbix 伺服器在故障轉移到被動節點時處於離線狀態
兩台 Zabbix 2.4 伺服器使用 CentOS 6.6 和外部 MySQL 數據庫,兩台伺服器都配置為在執行時連接到該數據庫。
我結合了Zabbit 高可用性指南和Clusterlabs的快速入門。我想我已經完成了設置,因為當我進行故障轉移(node1 到 node2)時,虛擬 IP 被分配給 Active 節點並且 zabbix-server 服務也開始執行。
但是,Web 界面顯示 Zabbix 伺服器未執行。我在日誌文件中看不到任何錯誤或警告。當我故障回到 node1 時,一切都很好,並且 web ui 說 zabbix 伺服器正在執行。
*********** This is the node where Zabbix server is fine [root@zabbixserver3 ~]# netstat -ntap | grep 10051 tcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN 14880/zabbix_server tcp 0 0 10.99.99.93:38034 10.99.99.93:10051 TIME_WAIT - tcp 0 0 10.99.99.93:38032 10.99.99.93:10051 TIME_WAIT - tcp 0 0 10.99.99.93:38022 10.99.99.93:10051 TIME_WAIT - tcp 0 0 10.99.99.93:38024 10.99.99.93:10051 TIME_WAIT - tcp 0 0 10.99.99.93:38036 10.99.99.93:10051 TIME_WAIT - tcp 0 0 :::10051 :::* LISTEN 14880/zabbix_server
*********** This is the node where Zabbix server show not running [root@zabbixserver2 zabbix]# netstat -ntap | grep 10051 tcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN 31568/zabbix_server tcp 0 0 :::10051 :::* LISTEN 31568/zabbix_server
我發現了這個問題。這是 /etc/zabbix/web/zabbix.conf.php 中一個非常難以捉摸的錯字
我在伺服器名稱中有一個字元錯誤!