機架式伺服器可靠性(按品牌名稱和外形尺寸)
我們公司在兩個獨立數據中心的兩個集群上執行電子商務網站(數千個)。
基本上,我們需要操作的只是機架式伺服器節點。每個節點需要:
1.) 4 或 8 核 2.) 32 gb 記憶體 3.) 1 250 gb sata 磁碟 4.) 2 埠、千兆位、乙太網適配器 5.) 能夠啟動 Windows XP Pro
那它。我們在一個完全冗餘的、永遠線上的(希望如此!)集群中執行大約 40 個這樣的節點(我們自己編寫了集群部分)
以前,我們購買了白盒系統(基本上有一家小商店根據我們的規格定制我們的伺服器(超微))。
在我們上一輪節點購買之前,該方案執行良好。在上一輪節點購買中出現了超超超高的失敗率(6個月內失敗了30%。)沒有任何原因,PSU壞,記憶體不好,主機板炸了等。
我的問題是:
如果我們從知名品牌供應商 (IBM/DELL/HP) 購買,我們會獲得更一致的可靠性,還是我們基本上處於與以前一樣的可靠性廢話狀態?請記住,這些是低端伺服器。我們不會過渡到大型機或任何異國情調的東西。
我們的可靠性會隨著伺服器的外形尺寸而變化嗎?也就是說,2u 伺服器會比高密度、1 u 盒子伺服器中的 2 個節點更可靠嗎?
有沒有人從白盒伺服器過渡到名牌伺服器(或改變了外形)並且有故事要講?
一般來說,品牌名稱往往比白盒更可靠(儘管在我的世界中,supermicro 不算是“白盒”),但是你仍然會偶爾遇到名牌硬體的厄運。但是,如果您的購買量很大並且與一個較大的孩子有過接觸,那麼您所做的往往是解決這些問題的快速轉變。如果您從白盒供應商那裡得到一批不合格的主機板,那麼他們將有一堆備件用於替換它們的機會有限,而大牌將有備件 - 並且是長期的、忠誠的客戶(即“搖錢樹”)將首先獲得該庫存。
但歸根結底,它是電腦硬體,這就是我們對收到的所有硬體進行廣泛老化測試的原因。一旦你進入大規模管理,這些事情就會以驚人的規律發生,並且讓它在測試架上失敗是一個比在生產中失敗更好的選擇(即使你確實有大量冗餘系統)。
另外,“執行 XP Pro”——你是認真的嗎?