Database

ProLiant Gen8 伺服器中的第三方 SSD 解決方案

  • March 6, 2021

我想知道是否有人在 HP (DL380p) Gen8 伺服器中使用 Intel DC3700 SSD(或類似產品)有任何具體經驗?

我正在升級一組使用直連儲存的數據庫伺服器。通常,我們在我們的伺服器配置中使用惠普品牌的所有東西,除了一些 SSD 台式機(所有這些都可以完美執行)之外,我沒有使用過 SSD - 當然不是在伺服器中。

我們正在升級的伺服器在 Windows 上執行 SQL Server (2005)。我們正在遷移到 SQL 2012。目前的機器在 DL370 G6 上託管一個 200GB 數據庫,在 RAID 1+0 中配置了 72GB 15K SFF 驅動器,如下所示:OS(2 個主軸)、tempdb(4 個主軸)、t-logs(8 個主軸) ),數據(20 錠)。性能不是問題(CPU 負載通常為 20% / 峰值 30%,磁碟隊列為 typ = 1)。數據卷磁碟在 P800 上的 MSA50 中執行 - 所以那裡可能有 5K IOPS。硬體已經接近 4 年了,所以是時候更新了。

各個硬碟報告的數據使用情況顯示,自部署在數據卷上以來的寫入量 < 100TB;< 10TB 寫入事務日誌卷;和 ~ 1TB 在 tempdb 上。

這就是案例。現在考慮一個新的、相同的磁碟子系統。會跑的~ $ 15K per server (34x 15K HDD @ $ 250 + 2 個 D2700 架子 + 用於外部儲存的智能陣列 P421)。

考慮一個類似的 SSD 部署,比如 6 個 200GB SSD 用於數據卷,每個 2 個 (100GB) 用於 OS、tempdb 和日誌記錄。或許有些矯枉過正,但將英特爾 DC S3700 與第二個陣列卡一起使用可為我帶來每台伺服器大約 5000 美元的收入。此外,它適合一個 2U 的盒子(使用 DL380p 上的擴展籠),每年可節省數百美元的電費。隨著 SSD 性能的提高,這甚至可能涵蓋一些草率的查詢;-)。

等效的“無憂”HP SSD 解決方案將執行約 10.5 萬美元。價格翻倍,保修更少,耐用性更低,但性能和可管理性得到保證。

當然,有很多中間解決方案可以工作。我也很清楚供應商支持的解決方案與第 3 方的權衡。我沒有整合這些特定產品以幫助量化這些權衡的經驗。我希望有人在那裡,並願意分享他的經驗。

我想到的問題是:

S3700 使用 Array P42x/P822 卡在 Proliant 環境中是否表現良好?如果使用 S3700,使用 3rd 方卡是否有優勢,比如 LSI 9270-8i?正如我所概述的,如何(很容易)使用第三方解決方案完成韌體升級或管理警報?

如果裝配存在特定問題,您是如何解決這些問題的 - 假設您有?

隨著 SSD 引入儲存領域的變化,儲存解決方案甚至不如幾年前那麼簡單。我敢肯定,再過幾年它們就會大不相同,我們原本預計要再等一個週期,然後再認真考慮在任何伺服器應用程序中使用 SSD。

在我沿著這條路走得太遠之前,有沒有人會分享他們的相關經驗?請告訴我們為什麼我們聰明、瘋狂或介於兩者之間。

這是一個更新,總結了我對這個問題的看法。感謝您的貢獻!

公平地說,最初的問題假定 OEM 儲存解決方案(在這種情況下為 HP SSD)在組件兼容性和系統性能方面提供了受支持或“保證”的工作解決方案。這顯然是溢價,而感知價值表明溢價的合理程度。

雖然我真的放棄了在這次硬體更新中使用 SSD 的想法,但英特爾 S3700 上的媒體特別使 SSD 解決方案具有足夠的吸引力,值得考慮。查看同等的惠普產品,我發現 (1) 它們目前不可用,(2) 預期的價格溢價是英特爾產品的 2.4 倍。那麼,問題就變成了集成和驗證英特爾解決方案需要付出多少努力?理解這一點會導致一個非常特定於產品的解決方案與 serverfault 的目標背道而馳,因此我將使用提供的答案概括我的思考過程:

  1. 無論是供應商集成還是 DIY,在為旋轉磁碟優化的 RAID 控制器後面懸掛 SSD 仍然存在很多變數。惠普建議對 SSD 的使用進行各種調整,ewwhite 提到的 HP SmartPath 軟體(僅限 Gen8 RAID + Windows)在使用 SSD 時基本上會短路大部分 RAID 韌體。惠普對 Gen8 運營商的額外“保護主義”,以及管理 3rd 方 SSD 的韌體更新(我認為這比 HDD 更重要)也使得這一切在黃金時段看起來有點太不成熟(或管理過於密集)在復雜的設置中。
  2. 不過,在我回到旋轉磁碟之前,我又看了看 FusionIO 產品,正如 Tom O’Connor 建議的那樣。由於性能對我們來說不是真正的問題,最大的好處是它是一個集成的儲存模組。這使得兼容性和配置更加直接。另一個重要的一點是惠普 OEM 這些,所以你可以在這條線上獲得“真正的”惠普產品,集成變得更不成問題。此外,與我考慮的 SATA/SAS SSD 形成鮮明對比的是,HP 的廣告(線上)價格實際上比 FusionIO 的要好。去搞清楚。

考慮到這篇文章重新考慮部署,我考慮使用單個 FusionIO 卡建構可用性節點。這將解決方案成本從“不能考慮”降低到“讓我們進一步調查”。最後,當實際報價好於預期時,我被賣掉了。

所以底線是我們有兩台 Gen8 伺服器執行在沙盒中,執行 HP 品牌的 FusionIO 卡。耐用性將遠遠超出我們的預期用途,成本低於 15K SAS 磁碟解決方案,我們將大幅降低功耗和機架空間。當然,冗餘模型是不同的,但我希望人們唯一會錯過的是所有閃爍的 LED。

對於任務關鍵型數據庫系統,我最初的想法是等待幾年,因為會有更多成熟且經過驗證的解決方案以更好的價格出現。毫無疑問,情況仍然如此,但我很驚訝今天發現一些看起來可以很好地完成工作的東西。

我在這裡多次介紹了與 HP 伺服器的 SSD 互操作性和兼容性問題。

檢查這些文章:

HP D2700 機箱和 SSD。任何SSD都可以工作嗎?

是否有任何 SAN 供應商允許第三方驅動器?

因此,從 G6 和 G7 HP ProLiants 到 Gen8 變體的轉變迫使磁碟載體的外形尺寸發生變化。惠普帶著 Gen8 產品去了SmartDrive 運營商,這造成了一系列影響 SSD 兼容性的問題。

我喜歡在合理的範圍內為我的環境和應用程序選擇最合適的選項的想法。使用 G7,我可以在需要時使用 HP 的 SanDisk/Pliant SAS 企業 SSD,但也可以在有意義的情況下使用 Intel 或其他基於 SandForce 的低成本 SSD 。如果使用 D2700 或 D2600 等外部機箱,我還可以使用sTec SSD(它提供另一種優質的 SAS SSD 選項)。舊外形的驅動器載體很容易獲得。

使用 Gen8 伺服器,這在很大程度上是不可能的。從難以訪問 SmartDrive 載體到限制性韌體和磁碟驗證技術,再到 HP 品牌 SSD 的高昂價格(每個驅動器 2500 美元以上),我認為 HP 已經將自己排除在市場之外。

他們重新命名的驅動器不是出色的表演者,但具有巨大的耐力。並非所有環境都需要這樣做。在目前 HP Smart Array 控制器上獲得 HP SSD 的最佳性能還需要調整甚至額外的HP SmartPath 許可。以前的控制器(如 Smart Array P410)受到 IOPS 和其他約束的限制

HP SmartCache SSD 分層可能會影響您在 Gen8 伺服器上的應用程序的一個很好的開發。與 LSI 的 Cachecade 非常相似,它允許您添加 SSD 讀取記憶體並在重要的地方受益於更低的延遲。另請參閱:LSI CacheCade SSD 儲存分層的效果如何?

一般來說,我不關心具有磁碟外形的 RAID 設置中的 SSD 可靠性。基於 PCIe 的 SSD 引入了其他問題。我沒有遇到任何耐用性問題,但請檢查:SSD 驅動器是否與機械驅動器一樣可靠(2013 年)?


所以,你可以做什麼?

  • D2700 外殼可能是這裡的關鍵。它使用較舊的 G7 磁碟托架。它也是一個非常堅固的單元,與新舊控制器兼容。你可以整天把 Intel/sTec/cheapo 磁碟塞進去,一切都好。將其連接到主機中的適配器,這將為您提供所需的靈活性。使用 DL360p 而不是 DL380p 可以節省機架單元。
  • Gen8 伺服器內的英特爾磁碟…我不會這樣做,如果出於任何原因而不是避免POST 1709錯誤。此外,您將以影響主伺服器單元的方式實現自我支持。我剛讓一位客戶嘗試用英特爾 SSD 和 eBay 驅動器托架填充 25 托架 DL380p Gen8。他不得不退回 Intel 驅動器並使用低端 HP SATA 磁碟來使系統正常工作。

HP ProLiant DL380p Gen8提供8-bay、12-bay 15、16 -bay 和 25-bay 單元。

  • 8-bay一直很好。這是一個很好的平台,特別是如果您添加外部儲存。
  • 16-bay Gen8 沒有 SAS 擴展卡(並且與優秀的 HP SAS Expander不兼容),因此您需要兩個內部 RAID 控制器才能使用它。因此,您的邏輯驅動器無法跨越兩個 8 托架驅動器籠。這與 G7 不同,後者在一個陣列中使用 16 個托架/磁碟是沒有問題的。
  • 25 托架單元有一個令人擔憂的設計缺陷。SAS 擴展器嵌入在 25 驅動器背板上。此背板需要具有 FBWC 記憶體的 P420i 控制器才能執行。美好的。不過,我在 60 天內有3 個RAID 控制器 DIMM 當機。在 8 托架單元上,這只是禁用寫記憶體。在 25 盤位伺服器上,記憶體故障使 Smart Array 成為“零記憶體”控制器並禁用對磁碟的所有訪問!!除非您能接受這種風險,否則請避免使用此模型。我在 2GB 記憶體模組上的故障率遠高於 1GB 模組,因此我針對這個特定平台降級到 1GB 模組。

1746 插槽 z 驅動器陣列 - 檢測到不支持的儲存連接 - 此控制器型號不支持通過擴展器的 SAS 連接。已禁用對所有儲存的訪問。

在此處輸入圖像描述

引用自:https://serverfault.com/questions/528875