Cluster
被踢出的心跳節點不會重新加入虛擬 IP 服務
我們有一個為虛擬 IP 提供服務的 2 節點心跳集群。之前由於錯誤,node1 的網路介面當機,導致集群將 node1 從虛擬 IP 方中踢出。
現在我們已經修復了它,node1 不再重新加入虛擬 IP 方。將 node2 設置為備用不會觸發到 node1 的故障轉移。
我對心跳不熟悉。是否有任何配置/命令可以讓我反轉/配置/取消黑名單?
經過一番探勘,事實證明在網路介面崩潰期間失敗計數已達到其極限。因此,資源拒絕遷移回工作節點。我可以查看每個資源的失敗計數:
pcs status failcount show <resource_id> [node]
來源 :
$ pcs resource help
為了解決它,我執行了這個:
crm_resource --cleanup
這清除了我資源的所有失敗計數。( https://clusterlabs.org/pacemaker/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/s-failure-handling.html ) 現在,故障轉移工作正常,一切正常。