Networking

ESXi 主機失去與 vCenter 的連接

  • March 21, 2014

我對單個 ESXI 主機有一個非常奇怪的問題。

我有 2 個相同的主機,核心 i3、6 個 nics、16g ram。其中 4 個網卡用於管理、vmotion、vm 網路,都在不同的 vlan 上。它們都連接到靜態中繼中的 HP Procurve 24 埠千兆交換機。另外兩個網卡是 iSCSI。

有 2 個 VSS,一個有 4nics,第二個只有 2 和 iSCSI 流量。

兩台主機上的配置相同,硬體相同。兩台主機都以大約 30% 的 CPU 和記憶體使用率執行。他們正在執行 ESXI v. 5.1。

正在發生的事情是主機 2 會突然退出 vCenter。(vCenter 託管在物理機上)。沒有錯誤,它只是失去了連接。

如果我嘗試從 vCenter ping 主機,我不能。如果我嘗試從我的工作站 ping 通,我大部分時間都可以,並且可以通過 SSH 連接到它。如果我從 DCUI “測試管理網路”,它可以 ping 網關和 dns 伺服器。如果我重新啟動管理網路,我仍然無法從 vCenter 訪問它。

如果我執行 services.sh 重新啟動,它會全部完成且沒有錯誤但沒有幫助,主機仍然無法向 vCenter 註冊,也無法被 vCenter ping 通。

到目前為止,唯一可以解決此問題的方法是完全重新啟動主機。我做了一個日誌導出,但現在我什至不確定要尋找什麼。我應該查看哪些日誌?我可以補充的唯一另一條資訊是,這似乎發生在一天中的同一時間,清晨。此時沒有任何執行,沒有備份作業等。

每當我在白盒硬體上看到這些問題時,我都會檢查所涉及的關鍵組件(NIC、儲存)的驅動程序(和韌體),然後建議使用VMware Patch Portal或更新管理器更新到 ESXi 發行版的最新版本。

實驗室或無實驗室,您正在執行舊版本:ESXi 1065491與目前的ESXi 1483097

首先執行更新:VMware ESXi 5 更新檔是累積的嗎?

之後,我將深入研究實際主機的日誌,以查看 vCenter 斷開連接時間附近發生的情況。檢查/var/log/hostd.log/var/log/vmkernel.log

如果您確定沒有任何防火牆、DNS 或其他網路問題,那麼這是了解正在發生的事情的最佳選擇。

如果一切都失敗了,這就是ESXi,並且您擁有共享儲存。花時間對這樣的建構進行故障排除並不總是有用的,尤其是在其他主機執行良好的情況下。通過 PowerCLI 複製您的設置,重建並恢復主機。

引用自:https://serverfault.com/questions/570996