Cluster

被踢出的心跳節點不會重新加入虛擬 IP 服務

  • June 17, 2019

我們有一個為虛擬 IP 提供服務的 2 節點心跳集群。之前由於錯誤,node1 的網路介面當機,導致集群將 node1 從虛擬 IP 方中踢出。

現在我們已經修復了它,node1 不再重新加入虛擬 IP 方。將 node2 設置為備用不會觸發到 node1 的故障轉移。

我對心跳不熟悉。是否有任何配置/命令可以讓我反轉/配置/取消黑名單?

經過一番探勘,事實證明在網路介面崩潰期間失敗計數已達到其極限。因此,資源拒絕遷移回工作節點。我可以查看每個資源的失敗計數:

pcs status failcount show <resource_id> [node]

來源 :

$ pcs resource help 

為了解決它,我執行了這個:

crm_resource --cleanup

這清除了我資源的所有失敗計數。( https://clusterlabs.org/pacemaker/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/s-failure-handling.html ) 現在,故障轉移工作正常,一切正常。

引用自:https://serverfault.com/questions/971672