Vmware-Esxi

如何對 ESXi 6.7 上可能出現的驅動器問題進行故障排除?

  • September 26, 2019

我有一個 RAID 中有 4 個驅動器的 Dell Poweredge R630。我不確定它是 RAID 10 還是 RAID 5,因為我最初沒有訂購或設置伺服器,而且我只是預設的網路管理員,這不是我的主要工作。該伺服器執行 vSphere Essentials ESXi 6.7,並託管了六台虛擬機。

我使用在另一台主機上的 VM 中執行的 Altaro VM 備份來備份該主機以及 ESXi 6.5 主機。當我開始備份這台主機上的虛擬機時,我發現備份會隨機失敗。我正在備份的 5 個虛擬機中的任何一個晚上 2 或 3 個都會失敗,但每晚的虛擬機都不相同。幾週前,他們開始總是失敗。

在與 Altaro 支持人員合作以找出失敗的原因時,他們在 Altaro 日誌中發現了這一點:

2019/09/24 00:11:31.034: DISKLIB-LINK : "san://snapshot-155[Storage] VMName/VMName.vmdk@192.168.1.1:443?User@domain.local/XXX" : failed to open (Unknown error). 
2019/09/24 00:11:31.034: DISKLIB-CHAIN : "san://snapshot-155[Storage] VMName/VMName.vmdk@192.168.1.1:443?User@domain.local/XXX" : failed to open (Unknown error). 
2019/09/24 00:13:18.446: VixDiskLib: Detected DiskLib error 2338 (NBD_ERR_NETWORK_CONNECT). 
2019/09/24 00:13:18.446: VixDiskLib: VixDiskLib_Read: Read 437 sectors at 19619760 failed. Error 14009 (The server refused connection) (DiskLib error 2338: NBD_ERR_NETWORK_CONNECT) at 5235.

他們的支持說這些日誌條目,我假設特別是最後一行,直接來自主機。

不是 ESXi 專家我不完全確定要在 ESXi 中查看哪些日誌文件以嘗試找出問題所在,確認這是主機上的驅動器問題,並確定它是哪個驅動器以便我可以更換它。到目前為止,vCenter 沒有發出任何有關驅動器問題的警報或警告,主機也沒有指示陣列存在問題。

另一個數據點:這些虛擬機中的大多數都執行 Windows。其中每一個都在內部執行 Windows 備份到一個單獨的驅動器,並且所有這些都完成且沒有錯誤。我發現有趣的是,Windows 能夠從 VM 內部備份其驅動器,但是當 ESXi 從外部進行備份時出現讀取錯誤。

這不是主機硬碟問題。日誌文件告訴您,由於網路錯誤,它無法打開 VM 的虛擬硬碟。

我的猜測是,與 Altaro 備份位於同一主機上的 VM 備份可能不會失敗。是對的嗎?

引用自:https://serverfault.com/questions/985665