Linux

Nvidia Pascal 架構:DMA 大小/主機系統 RAM 的最大數量?

  • November 4, 2016

我們計劃為機器學習和數據科學任務建構一對多 GPU Linux 伺服器。根據我們的要求,我們需要在這些機器中放置大量 RAM;我們計劃使用 24 個 64GiB LRDIMM,總共 1.5TiB。對於 GPU,我們打算使用 Titan X 以獲得最佳性價比,但根據Nvidia 的 Linux 驅動程序文件,目前的顯卡無法處理超過 1TiB 的主機系統 RAM。我聽說 Pascal 架構將增加定址能力的“謠言”,但我找不到任何可靠的文件來證實或反駁這一點。如果事實證明這是真的,我們可能會使用更新的 GTX 1080 卡,即使它們在顯卡上的 RAM 少了 4GiB。

因此我的問題是:是否有一些關於我缺少的 Pascal 定址能力的文件?

或者,可以使用 GTX 1080 的

grep DMA /proc/driver/nvidia/gpus/domain:bus:device.function/information 人為我執行嗎?

回答我自己的問題以供將來參考。我們決定使用 GTX 1080 卡。在驅動程序版本下367.57,他們報告了以下 DMA 功能:

$ grep DMA /proc/driver/nvidia/gpus/0000\:04\:00.0/information
DMA Size:    47 bits
DMA Mask:    0x7fffffffffff

因此,它們應該能夠處理多達 140 TB 的主機系統 RAM——對於我們的案例來說已經足夠了。

引用自:https://serverfault.com/questions/789336