Virtualization

基於 ZFS 的 DIY 儲存系統的硬體建議

  • August 3, 2011

希望利用閒置的舊伺服器作為概念驗證……以下是戴爾 PE 2900 的規格:Xeon 5110 - 2P、12 GB RAM、8 個 300 GB 15K 驅動器、Perc 5i+256 MB 記憶體

伺服器和主機上需要哪些額外的硬體?1GB乙太網卡,1GB交換機?

有 4 個 ESX 伺服器可以連接到此儲存伺服器(iSCSI 或 NFS)

推薦什麼軟體?開放式太陽能?Nexenta 社區版?自由NAS?

感謝任何指向指南、教程的連結。

馬魯蒂

安裝 OpenSolaris (b134) 的最新開發版本。

如果您想要性能,請使用您擁有的這八個磁碟創建 4 個鏡像 vdev。

為了獲得更好的性能,請使用兩個鏡像的 SLC SSD 作為日誌設備和一個額外的 SSD 作為記憶體。

對於 ZFS,影響總體成本、性能和您對所建構系統的滿意度的因素有很多。

可支持性 如果您需要在遇到問題時打電話給某人,而不是自己動手,請購買 Sun 7000 統一儲存設備。它們有點貴,但你得到你付出的代價。高質量的硬體,最新的 OpenSolaris 程式碼以設備形式……哦,還有值得一試的 Analytics。這是您從 Oracle 購買 OpenSolaris 支持的唯一方法,而且您的財力相對雄厚,與您的 Oracle 代表交談可能是值得的。(這是給我工作的)

軟體由於 Solaris 10 不具備出色的前沿 ZFS 功能(去重、非鏡像 ZIL、COMSTAR iSCSI/FibreChannel 目標等),因此您需要基於 OpenSolaris 位執行一些東西。由於 OpenSolaris 本身已死,而且 Illumos 還沒有完整的發行版,因此請考慮使用 Nexenta。它基本上是 OpenSolaris 核心 + Debian 使用者空間 (apt)。 Nexenta Core Platform可免費無限使用,但如果您願意為支持付費,請考慮NexentaStor ,儘管我不喜歡每 TB 美元(永久許可證起價為 $ 800 + $ 75/TB)。

鏡像與 RAIDZ1/RAIDZ2 在驅動器數量相同的情況下,基本上是 IOPS 和容量之間的鬥爭。對於大磁碟 (1-2TB),如果您認為鏡像過於昂貴,那麼一定要使用雙奇偶校驗 (RAIDZ2),因為多 TB 陣列的重建時間很容易超過一天。(更多:ZFS:鏡像與 RAID-Z)。不要忘記冗餘!=備份。

驅動器 我建議您考慮將儲存從伺服器機箱中分離出來。SuperMicro 製造了一些不錯的機箱,但不可避免地你會想要更多的儲存空間,而不是適合你的機箱,為什麼不從一個像樣的 SAS 機箱開始,當你擴展時再買一個。我會購買 7200RPM SATA 驅動器而不是 10k-15k SAS 驅動器,更多或鏡像主軸將以相同的 $$ 的價格勝過具有 ZFS 的快速昂貴磁碟。

記憶體購買大量記憶體。最低 12-16GB,如果您想考慮重複數據刪除,則為兩倍/三倍。

SSD如果您使用 iSCSI 或 NFS 進行虛擬機儲存,請務必為 ZIL 購買高端設備以加速同步寫入(請參閱:我對上一個問題的回答)。為 L2ARC 購買一個/多個像樣的 MLC SSD 作為二級讀取記憶體;如果您正在執行重複數據刪除,您會希望 L2ARC 的 SSD 足夠大以適合您的重複數據刪除表。

配置ZFS使文件系統的精簡配置就像在大多數環境中創建目錄一樣簡單。zfs create -V 40g pool/fsname然後zfs set shareiscsi=on pool/fsname你就完成了。使用快照 ‘zfs snapshot pool/fsname@snapname; 複製現有系統同樣簡單;zfs 複製池/fsname@snapname 池/newfsname’。這些操作很快(0 - 5 秒)。

更新 7/10/2010 以反映有關如何使用硬體的建議:

由於 Perc6 不支持將磁碟作為一堆磁碟直接傳遞(討論),因此您必須創建 8 個單磁碟 RAID 0 陣列。使用兩個作為鏡像對並在那里安裝您的根卷。zpool create poolName mirror c0t0d0 c0t1d0 mirror c0t2d0 c0t3d0 mirror c0t4d0 c0t5d0在第一次啟動後通過執行(通過查看“格式”命令的輸出替換您的磁碟ID )將剩餘的六個用作一組3個鏡像對(想想RAID10 )。注意:如果在重新啟動後失去了故障磁碟(以及相關的 RAID0 集),PERC 可能會重新編號,因此您應該相應地記下驅動器序列號/cXtXdX/slots 和文件/標籤。希望您永遠不需要它,但是如果您必須遷移磁碟或禁止執行恢復,擁有該資訊意味著它會減少痛苦。

在收購 Oracle 之前,我肯定會推薦 OpenSolaris 而不是 Nexenta Core Platform,但現在我肯定會傾向於 Nexenta CP。自 2010 年 3 月發布 OpenSolaris b134 以來,他們基本上是唯一持續定期更新的人。可以在兩者之間遷移 ZFS 池,但僅取決於磁碟上的 ZFS 版本,您可以在創建池時指定該版本(討論,參見第 3 條消息) . 我從未使用過 FreeNAS 或 EON,因此無法評論它們。

至於 NFS 與 COMSTAR iSCSI,您應該使用巨型幀在千兆位上進行測試。AFAIK,OpenSolaris/Nexenta 不支持 NIC 的硬體 TOE,但如果您在 VMWare 端啟用了 TOE 的 NIC,它們將減少 iSCSI 的 CPU 成本。您可以使用直接有線交叉進行測試,但對於多主機,您需要支持巨型幀的千兆交換機(最好是第 3 層交換機上的 iSCSI 優化 VLAN)。如果您也有光纖卡測試 COMSTAR 光纖通道目標。

為了利用 ZFS(HDD + SSD)的混合儲存功能,我會在沒有專用 ZIL 設備的情況下模擬您的使用情況,並查看性能是否足夠好(條帶化/鏡像 15k SAS 磁碟可能就足夠了)。如果沒有,在設置一個/多個非生產VM 後,暫時禁用 ZIL 並再次測量性能。如果您的性能要好得多,那麼 ZIL 是您設置的瓶頸,專用的 ZIL 設備將物有所值。DDRDrive X1 ( $ 2000, $ 1500 .edu) 專為 ZIL 設計,僅使用 PCI-E x1 插槽而不是驅動器托架。或者,您可以考慮用兩個非冗餘 2.5 英寸 SATA SSD 替換您的鏡像引導磁碟。專用於 ZIL 使用的超級電容器支持 SSD(Vertex2Pro 32GB 435 美元)和體面的 MLC SSD(如Intel X25-M 80GB 230 美元),其中一個小分區用於 root,其餘用於 L2ARC。ZFS ARC 很好地使用了更多 RAM,但 12GB 應該足以啟動。

我會將基準測試工具的建議留給另一個問題(很大程度上取決於您的儲存 -> vm 路徑、客戶作業系統和工作負載),但 DTrace 探測可以產生大量有用的數據,儘管有學習曲線(這是 Sun 7000 系列分析的地方)閃耀)。最後兩個注意事項,在開始之前更新您的 PERC6 韌體和 BIOS,如果您獲得了用於 L2ARC 的 SSD,它可能需要幾個小時才能變熱,所以不要只是將它放在冷的地方。

引用自:https://serverfault.com/questions/158874