Vmware-Esxi

無法初始化 NVML:未知錯誤 - 無法在使用 Vmware ESXI 6.7 的 vSphere 主機伺服器上完成 NVIDIA Tesla P100 網格設置

  • March 14, 2019

我無法使用on 在主機伺服器上設置NVIDIA Tesla P100網格設置。vSphere``Vmware ESXI 6.7``DELL EMC poweredge R740

當我嘗試執行nvidia-smi命令時,出現以下錯誤

Failed to initialize NVML: Unknown Error

NVIDIA驅動如下

#esxcli software vib list |grep -i nvidia 
NVIDIA-VMware_ESXi_6.7_Host_Driver 390.113-1OEM.670.0.0.8169922 NVIDIA VMwareAccepted 2019-03-06

它還顯示為在作業系統中載入的模組,如下所示

# vmkload_mod -l | grep nvidia
nvidia 0 13828

我們還完成了 BIOS 中的以下更改

Memory Mapped I/O above 4 GB - Enabled
Memory Mapped I/O above Base - 512 GB

主機作業系統:Vmware ESXI 6.7

NVIDIA 圖形硬體:Tesla P100

請幫我解決這個問題

我自己已經解決了這個問題。我從線上資源中找到了解決方案。正如上面提到的資源中所說,為了解決這個問題,我不得不DirectPath I/O在主機上禁用。

上述資源中提供的修復如下。

您需要禁用主機上的“DirectPath I/O”。導航到硬體 -> PCI 設備。確保顯卡沒有被選為直通設備。感謝 NVIDIA 的 Simon Schaber,他給了我最後的線索。

引用自:https://serverfault.com/questions/957339