High-Availability

Zabbix Web 界面顯示 Zabbix 伺服器在故障轉移到被動節點時處於離線狀態

  • May 13, 2015

兩台 Zabbix 2.4 伺服器使用 CentOS 6.6 和外部 MySQL 數據庫,兩台伺服器都配置為在執行時連接到該數據庫。

我結合了Zabbit 高可用性指南Clusterlabs的快速入門。我想我已經完成了設置,因為當我進行故障轉移(node1 到 node2)時,虛擬 IP 被分配給 Active 節點並且 zabbix-server 服務也開始執行。

但是,Web 界面顯示 Zabbix 伺服器未執行。我在日誌文件中看不到任何錯誤或警告。當我故障回到 node1 時,一切都很好,並且 web ui 說 zabbix 伺服器正在執行。

*********** This is the node where Zabbix server is fine
[root@zabbixserver3 ~]# netstat -ntap | grep 10051
tcp        0      0 0.0.0.0:10051               0.0.0.0:*                   LISTEN      14880/zabbix_server
tcp        0      0 10.99.99.93:38034           10.99.99.93:10051           TIME_WAIT   -       
tcp        0      0 10.99.99.93:38032           10.99.99.93:10051           TIME_WAIT   -       
tcp        0      0 10.99.99.93:38022           10.99.99.93:10051           TIME_WAIT   -       
tcp        0      0 10.99.99.93:38024           10.99.99.93:10051           TIME_WAIT   -       
tcp        0      0 10.99.99.93:38036           10.99.99.93:10051           TIME_WAIT   -       
tcp        0      0 :::10051                    :::*                        LISTEN      14880/zabbix_server
*********** This is the node where Zabbix server show not running

[root@zabbixserver2 zabbix]# netstat -ntap | grep 10051
tcp        0      0 0.0.0.0:10051               0.0.0.0:*                   LISTEN      31568/zabbix_server
tcp        0      0 :::10051                    :::*                        LISTEN      31568/zabbix_server

我發現了這個問題。這是 /etc/zabbix/web/zabbix.conf.php 中一個非常難以捉摸的錯字

我在伺服器名稱中有一個字元錯誤!

引用自:https://serverfault.com/questions/691822