Xeon

在 HPC 集群中使用 i7 ‘gamer’ cpu

  • August 26, 2013

我正在執行 WRF 天氣模型。這是一個記憶體密集型、高度並行的應用程序。

我需要為此建構一個 HPC 集群。我使用 10GB infiniband 互連。

WRF 不取決於核心數量,而是取決於記憶體頻寬。這就是為什麼核心 i7 3820 或 3930K 的性能優於高級至強 E5-2600 或 E7

似乎大學將至強 E5-2670 用於 WRF。它的成本約為 $ 1500. Spec2006 fp_rates WRF bench shows $ 580 i7 3930K 與 1600MHz RAM 的性能相同。

有趣的是,i7 可以處理高達 2400MHz 的記憶體,為 WRF 帶來了很大的性能提升。然後它真的勝過至強。功耗稍高一些,但每年仍不到 20 歐元。即使包括我需要的附加元件(PSU、infiniband、機箱),i7 方式仍然比 Xeon 便宜 700 歐元/cpu。

那麼,可以在 HPC 集群中使用“遊戲玩家”硬體嗎?還是我應該用至強做專業?

(這不是關鍵應用程序。我可以處理停機時間。我想我不需要 ECC?)

我們在高頻金融交易領域做了一小段時間(考慮到我正在使用的應用程序架構,與 HPC 非常相似)……

大約在 2010 年初,我部署到帶有10GbE Solarflare(帶有OpenOnload UDP 消息核心旁路)和/或 Infiniband 互連的定制 3U 機架式、單插槽 i7“遊戲系統” 。

我沒有 IPMI/帶外管理、電源管理、單電源和熱插拔元件。我們在不同的點同時使用 SSD 和內部 SAS 磁碟,但磁碟對於計算節點並不重要。作業系統是 Fedora Linux,具有高度定制和調整的核心。

這在概念驗證中有效,並且在我們對我們的交易應用程序如何在生產中對實時數據做出反應之前有所保留。然而,隨著事情的發展,這變成了一場管理噩夢……

冷卻、數據中心熱量/空間/密度(這些東西是 3U 盒子)、支持和遠端管理等問題最終扼殺了努力。雖然 CPU 在技術上從未出現過故障,但其他所有組件都有問題!. 而這只是每天生產使用 8 小時的周期…

我們長期做了什麼?

我們放棄了遊戲玩家 PC 並使用了適當的專用伺服器硬體。是的,這是一家金融公司,所以我們沒有預算限制,但考慮到未經證實的應用程序的潛在規模,我仍然需要注意定價。所有價格範圍內都有不錯的伺服器,如果您打算擴大規模,可以與製造商達成交易。您認為大型 HPC 研究實驗室集群不會為設備支付零售價,是嗎?我們也沒有…

因此,如果您想這樣做,請考慮大局。如果您只是想在其他伺服器級硬體中使用桌面級 CPU,它會工作……但我不建議將它用於全職使用。

如果您知道其中涉及的 CPU 限制和可用性問題,那麼我只能提供一個數據點以供考慮。

引用自:https://serverfault.com/questions/455307