Centos7

為無盤環境安裝 NVIDIA 驅動程序

  • January 16, 2017

我正在嘗試建立一個由 8 台電腦和一個主文件伺服器組成的集群。理想情況下,我想在 pxe-boot、準無盤/準無狀態環境中進行設置(即,唯一的本地儲存是/var,扭矩配置之類的東西會去的地方)。8 個計算節點中的每一個都有 4 個 NVIDIA Tesla K40m,但根文件伺服器沒有 GPU。

理想情況下,我希望能夠在文件伺服器 (at /node) 上創建完整的安裝,然後 PXE 將其引導到計算節點,但是,我還沒有找到在沒有 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程序的方法木板。我在 NVIDIA 的論壇上發現了一個關於有人嘗試此操作未成功的問題…

或者,我可以將 NVIDIA 驅動程序安裝到其中一個計算節點(一個目前正在其本地磁碟上執行 CentOS)以(例如)/usr/local/nvidia並跟踪它創建的文件並創建一個 tarball 以復製到文件伺服器安裝。

最後,我可以只維護八個獨立的安裝,但是,從長期維護的角度來看,我不喜歡這樣(每個計算節點都將執行扭矩作業,所以我希望節點看起來或多或少相同) .

總之,我要求的是:

  1. 我可以在沒有板載 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程序嗎?
  2. 我還有其他方法可以解決這個問題嗎?

作為參考,我們正在執行 CentOS 7。

[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

像其他所有東西一樣使用 RPM 包。

目前最好的NVIDIA 驅動程序包來自 Negativo17。

引用自:https://serverfault.com/questions/826450