被踢出的心跳節點不會重新加入虛擬 IP 服務

June 17, 2019

我們有一個為虛擬 IP 提供服務的 2 節點心跳集群。之前由於錯誤，node1 的網路介面當機，導致集群將 node1 從虛擬 IP 方中踢出。
現在我們已經修復了它，node1 不再重新加入虛擬 IP 方。將 node2 設置為備用不會觸發到 node1 的故障轉移。
我對心跳不熟悉。是否有任何配置/命令可以讓我反轉/配置/取消黑名單？

經過一番探勘，事實證明在網路介面崩潰期間失敗計數已達到其極限。因此，資源拒絕遷移回工作節點。我可以查看每個資源的失敗計數：
pcs status failcount show &lt;resource_id&gt; [node]
來源：
$ pcs resource help 
為了解決它，我執行了這個：
crm_resource --cleanup
這清除了我資源的所有失敗計數。( https://clusterlabs.org/pacemaker/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/s-failure-handling.html ) 現在，故障轉移工作正常，一切正常。

引用自：https://serverfault.com/questions/971672

相關問答

在 systemd 中使用心跳

October 11, 2015

使用哪個消息傳遞層，Heartbeat 還是 Corosync？

November 17, 2014

高可用性/故障轉移硬體連接

October 3, 2014

關於核心恐慌的心跳肉件 STONITH

July 15, 2013

Linux HA - 最佳心跳硬體解決方案

March 21, 2012

Red Hat/CentOS 集群與 HeartBeat 相比？

December 5, 2011