Virtualization

使用 PCI Passthrough 對 ESXi 硬體凍結進行故障排除

  • September 26, 2017

我有一塊帶有 Atheros AR5008 PCI Express 卡(D-LINK DWA-556,Device=0024&Vendor=168C)的 Supermicro X9SCM 板。該卡可以在 ESXi 中成功標記為 PCI 直通(我嘗試了 4.1 和 5.0 版),儘管每次我啟動一個與 Wifi 卡相關聯的虛擬機時 - 整個主機都會凍結並需要硬重置。

這張卡很有可能由於某種原因不兼容——儘管似乎至少有一份報告我可以找到它“工作”,或者至少客人能夠啟動。**我真的很想了解它為什麼會失敗。**我已經嘗試深入研究一些日誌文件和其他資源,看看我是否可以收集有關如何最好地解決此問題的任何知識,儘管我遠不是 VMWare 工具的專家。

這是我到目前為止所看到的:

  • BIOS,嘗試了最新版本 (1.1a) 和一個舊版本 (1.0c)。
  • 每當發生此凍結事件時,BIOS 都有一個日誌報告“PCI ERR”或“PCI ERR - Asserted”。
  • 我從 ESXi 主機上的 /var/log 中獲取了各種日誌,儘管我還沒有真正從它們那裡看到任何有用的東西。也許我不知道去哪裡找。
  • 我嘗試將 PCI 卡添加到 passthru.map 文件中,看看是否可以向 ESXi 提示它應該如何執行,但沒有運氣。(注意:我還沒有嘗試過所有重置方法/ fpt 可共享的組合)
  • 我已閱讀“活動”PCI Express 卡可能有所不同。我相信這可能指的是活動狀態電源管理,儘管我不知道如何檢查它。
  • 我已聯繫 Supermicro 支持以查看 BIOS / 硬體是否存在已知問題,但我還沒有收到回复。我也嘗試加入 VMWare 社區並在他們的論壇上發帖,儘管由於某種奇怪的原因我無法啟動我的帳戶。

同樣,我真正的問題是:我如何理解為什麼這個設備在分配給來賓時會導致管理程序鎖定?

鎖定的可能不是 Hypervisor,而是某種硬體(如 PCIe 開關)。如果沒有任何類型的PCIe 調試硬體和一大堆特定於 PCIe 的知識,您將很難調試它,因此它可能不值得追求。一般來說,如果沒有大量考慮,您不應該使用 PCI 直通。

如果您需要虛擬機上的無線連接介面,請考慮使用外部設備(路由器/網橋)將無線網路橋接到有線網路,並使用虛擬機內部的虛擬介面連接到該網路。另一種選擇是使用 USB 插入介面和USB 網路重定向器

引用自:https://serverfault.com/questions/380478