Centos7
為無盤環境安裝 NVIDIA 驅動程序
我正在嘗試建立一個由 8 台電腦和一個主文件伺服器組成的集群。理想情況下,我想在 pxe-boot、準無盤/準無狀態環境中進行設置(即,唯一的本地儲存是
/var
,扭矩配置之類的東西會去的地方)。8 個計算節點中的每一個都有 4 個 NVIDIA Tesla K40m,但根文件伺服器沒有 GPU。理想情況下,我希望能夠在文件伺服器 (at
/node
) 上創建完整的安裝,然後 PXE 將其引導到計算節點,但是,我還沒有找到在沒有 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程序的方法木板。我在 NVIDIA 的論壇上發現了一個關於有人嘗試此操作未成功的問題…或者,我可以將 NVIDIA 驅動程序安裝到其中一個計算節點(一個目前正在其本地磁碟上執行 CentOS)以(例如)
/usr/local/nvidia
並跟踪它創建的文件並創建一個 tarball 以復製到文件伺服器安裝。最後,我可以只維護八個獨立的安裝,但是,從長期維護的角度來看,我不喜歡這樣(每個計算節點都將執行扭矩作業,所以我希望節點看起來或多或少相同) .
總之,我要求的是:
- 我可以在沒有板載 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程序嗎?
- 我還有其他方法可以解決這個問題嗎?
作為參考,我們正在執行 CentOS 7。
[root@compute-3 /]# uname -a Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
像其他所有東西一樣使用 RPM 包。
目前最好的NVIDIA 驅動程序包來自 Negativo17。