Virtualization

適用於最小企業的容錯伺服器結構

  • August 31, 2010

我正試圖弄清楚如何為一家受到荒謬硬體問題困擾的小企業做點什麼。目前,這項業務在五六台台式機上執行;沒有伺服器基礎設施到位。最重要的是,我並沒有美化這一點,今年迄今為止,他們已經看到了四次硬體故障,這讓他們近乎瘋狂。

我已經與他們討論過安裝小型企業伺服器的想法(他們是微軟商店),他們接受了這個想法。我還計劃使用 System Center Essentials 讓我的腳濕透,以密切關注事物。然後重點變成確保該伺服器保持可用。

另外,我剛剛通讀了另一個高可用性執行緒。就像那個執行緒中的那個人一樣,我對 IT 非常陌生,而是來自程式背景。

一些想法浮現在腦海:

  • 帶有熱插拔**編輯的簡單 raid-5:**和熱備用
  • 獲得兩台更便宜的伺服器機器,配置為執行一台具有熱遷移功能的虛擬化伺服器(我已經閱讀了一些資料,但遺憾的是我不知道 SBS 標準和 SCE 是否會支持這一點)
  • 故障轉移集群?我從另一個執行緒中得到了這個術語,但過去沒有接觸過它。

在這方面有最佳實踐嗎?企業主願意為此掏腰包,因為他開始害怕停機,但我沒有這些經驗可以引導我朝一個方向前進。

我很感激你的智慧!

**編輯:**為了提供一些關於他們所經歷的問題的額外細節,這是一種莫名其妙的失敗的奇怪組合。

  • 機箱上的開關無法啟動系統:主機板有板載開關,它提供了一個權宜之計的解決方案,但是關閉機箱並不能解決問題。後來,換掉主機板也沒有解決問題。
  • 兩台相同的機器在他們的 raid-1 陣列中都遭遇了驅動器故障,這兩台機器的組裝時間都不超過 5 個月。
  • 引導失敗問題:raid-1 中的一個系統根本無法引導。不幸的是,我沒有寫下最初的錯誤消息,但在我的筆記中,我發現 Windows 修復和恢復中的“無法保存啟動選項”讓我找到了 這個執行緒,這支持了我對硬體相關問題的懷疑。

**編輯:**此外,這些機器在一系列家庭辦公室中執行,因此住宅級電氣正在發揮作用。我想這可能比我認為的更重要。然而,這些機器都是在桌子上(字面意思是台式機!)而不是在地板上執行的。我不相信涉及灰塵。

首先,SCE 對於 5-6 台台式機來說太過分了。WSUS 可能是一個更好的選擇,而且是免費的。

你沒有說太多到底是什麼失敗了。它是機器的一部分嗎?這是一個塵土飛揚的環境嗎?我的主要支持環境是大約 40 個使用者和大約 10 台伺服器(不包括虛擬化)。我們購買了戴爾機器(Optiplex 的),在過去 5 年中,我們可能在所有這些東西上發生了 4 次硬體故障。所以你在工作站上看到的,是不正常的。

他們是否有合適的伺服器機房/伺服器位置(至少有冷卻且沒有很多灰塵?)

帶有熱插拔的 Raid-5 是在此伺服器上執行的一種廉價方式,並提供了一些針對硬碟驅動器故障的保護。我還會添加冗餘電源(便宜)和 UPS。

  • 伺服器類硬體
  • Raid on hard drive (edited to add) 有一個可用的熱備件可能是矯枉過正,因為大多數在保修期內的驅動器可以在一夜之間。例如,在 raid-5 中有 3 個驅動器,您可能會失去一個驅動器並且在新驅動器到來之前一切正常。但是,失去> 1個驅動器,無論您如何看待它,您都被搞砸了。
  • 冗餘電源
  • 適當的保修(例如,對於戴爾,我們可以獲得下一個工作日並保留您的硬碟驅動器,因為我們的任何伺服器都可以承受一天的停機時間。)
  • 備份解決方案

故障轉移集群?對於如此小的環境,您開始進入一個既昂貴又復雜的領域。請記住,在如此小的環境中,雖然正常執行時間很重要,但同樣重要的是要記住您希望使事情盡可能簡單

至於工作站,請解決問題(您還不是很清楚)。也許您可以購買一個帶有基本映像的“額外”工作站,它就坐在那裡從 WSUS 獲取您的所有更新,如果他們的一個工作站當機,您可以將其用作交換機器(這就是我們所做的) . 我們還有大量可以更換的零件,以更換最常見的當機零件(電源、記憶體、硬碟驅動器),直到保修零件到達。

備份。沒有任何冗餘可以替代良好的備份。您在這裡有很多選擇。在如此小的環境中,您可以看到許多(想到 Mozy、Carbonite)線上解決方案,它們以合理的成本同時處理異地和自動化。您還可以使用磁帶解決方案,並使用 Iron Mountain 之類的服務將磁帶存放在異地。 ***無論你做什麼,都不要把磁帶帶回家!***特別是如果他們有有價值的資訊(SS#等)

引用自:https://serverfault.com/questions/171410