Vmware-Esxi

無法正確安裝或配置 vSphere 6.5 HA 代理

  • March 28, 2019

上週我們遇到了以下問題:由於更換 UPS,我們不得不關閉整個基礎設施。在電氣操作結束時,我們重新啟動:

  1. 網路
  2. 沒有
  3. vCenter
  4. ESXi(集群中的 2 個)

等待 ESXi 啟動後,我們發現集群出現錯誤:配置資源不足,無法滿足集群上所需的 vSphere HA 故障切換級別

然後我們發現 vCenter 無法通過網路聯繫 ESXi:交換機的 PDU 在操作期間被拔下。

重新插入 PDU,ESXi 現在可以與 vCenter 通信,但每個主機上都出現以下警報:vSphere HA 代理無法正確安裝或配置

我們決定重新啟動兩個 ESXi,但運氣不好,錯誤仍然存在。

由於維護視窗的限制,我們決定將兩台主機從集群中移除,以便能夠啟動我們的虛擬機,代價是在一台主機發生故障時不會自動進行故障轉移。

在Google上搜尋了很多之後,閱讀了我們嘗試的許多 VMware 的 KB(無順序):

沒有結果了…

在我們的旅程中,我們發現/var/log/fdm.log兩台主機上只有一個錯誤:

2018-06-25T09:05:54.232Z error fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterPersistence::DoFetchDataSync] Open of file /etc/opt/vmware/fdm/kvstore failed: No such file or directory
2018-06-25T09:05:54.232Z warning fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterManagerImpl::ReadPersistentObject] Couldn't open kvstore

Google搜尋這個 kvstore-thing 讓我一無所獲,也許我必須審查我的 google-fu …

我知道您提到您已經嘗試過,但如果它對其他人有幫助,我只想說我們的解決方案是從整個集群中完全禁用/刪除 HA 配置,然後再次啟用它。除了你的文章,我也找不到任何關於這方面的資訊。

我們有完全相同的問題。剛剛在 5 個伺服器中的第 3 個伺服器上完成了對 6.5 的更新。前兩個更新很好,HA 沒有問題。第三個很好,但 HA 不會回來。同樣的錯誤。fdm.log 文件中的相同消息(打開文件 /etc/opt/vmware/fdm/kvstore 失敗:沒有這樣的文件或目錄)。

引用自:https://serverfault.com/questions/918304