Vmware-Esxi
無法正確安裝或配置 vSphere 6.5 HA 代理
上週我們遇到了以下問題:由於更換 UPS,我們不得不關閉整個基礎設施。在電氣操作結束時,我們重新啟動:
- 網路
- 沒有
- vCenter
- ESXi(集群中的 2 個)
等待 ESXi 啟動後,我們發現集群出現錯誤:配置資源不足,無法滿足集群上所需的 vSphere HA 故障切換級別。
然後我們發現 vCenter 無法通過網路聯繫 ESXi:交換機的 PDU 在操作期間被拔下。
重新插入 PDU,ESXi 現在可以與 vCenter 通信,但每個主機上都出現以下警報:vSphere HA 代理無法正確安裝或配置。
我們決定重新啟動兩個 ESXi,但運氣不好,錯誤仍然存在。
由於維護視窗的限制,我們決定將兩台主機從集群中移除,以便能夠啟動我們的虛擬機,代價是在一台主機發生故障時不會自動進行故障轉移。
在Google上搜尋了很多之後,閱讀了我們嘗試的許多 VMware 的 KB(無順序):
- 斷開/重新連接主機
- 在沒有虛擬機的情況下將主機一一重新分配到集群
- 重新啟動 vSphere High Availability 服務重新配置 HA (FDM)
- 重新檢查網路需求搜尋 vSphere 6.x 的網路埠圖
- 禁用/啟用 HA對 VMware 高可用性進行故障排除
- 解除安裝/重新安裝 FDM KB 2056299
沒有結果了…
在我們的旅程中,我們發現
/var/log/fdm.log
兩台主機上只有一個錯誤:2018-06-25T09:05:54.232Z error fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterPersistence::DoFetchDataSync] Open of file /etc/opt/vmware/fdm/kvstore failed: No such file or directory 2018-06-25T09:05:54.232Z warning fdm[47A8940] [Originator@6876 sub=Cluster] [ClusterManagerImpl::ReadPersistentObject] Couldn't open kvstore
Google搜尋這個 kvstore-thing 讓我一無所獲,也許我必須審查我的 google-fu …
我知道您提到您已經嘗試過,但如果它對其他人有幫助,我只想說我們的解決方案是從整個集群中完全禁用/刪除 HA 配置,然後再次啟用它。除了你的文章,我也找不到任何關於這方面的資訊。
我們有完全相同的問題。剛剛在 5 個伺服器中的第 3 個伺服器上完成了對 6.5 的更新。前兩個更新很好,HA 沒有問題。第三個很好,但 HA 不會回來。同樣的錯誤。fdm.log 文件中的相同消息(打開文件 /etc/opt/vmware/fdm/kvstore 失敗:沒有這樣的文件或目錄)。