High-Availability

遠端數據中心之間 HA 的最佳選擇?

  • September 28, 2010

我們正在審查新客戶帶給我們的系統要求。他們在醫療領域工作,他們希望我們託管的系統必須至少具有高可用性,並且最好是容錯的。

我們正在考慮授權 VMWare Enterprise 以通過 FT 兼容硬體獲得其 HA 和 FT 功能。沒什麼大不了的 - 10Gbs 乙太網的價格正在下降,而 1Gb 乙太網不是問題。

然而,客戶的要求之一是我們在一個完全不同的城市有一個 HA(不是 FT,但 FT 會很好)站點。

澳大利亞的頻寬非常昂貴,我什至不知道是否有可能在悉尼和墨爾本(相距約 1000 公里/600 英里)之間建立 1Gbps 的鏈路。我可能很難在兩個城市之間建立 100Mbps 的鏈路。

提供 HA 系統有哪些選擇?不一定要使用 VMWare,但如果一個站點出現故障,我需要能夠登錄到第二個站點並點擊“開始”按鈕並啟動並執行。

我目前正處於為 $WORK 設置 DR/HA 遠端數據中心的初始規劃/實施階段。我們目前的環境已經高度虛擬化,無論是在伺服器虛擬化 (VMware) 還是儲存虛擬化 (Compellent SAN) 方面。因此,我們認為利用這些技術及其可用的 HA 解決方案是最有意義的。

我們所有的 VMFS 卷目前都位於 Compellent SAN 上,我們將使用它們的捲非同步卷複製來使遠端站點的另一個 SAN 上的內容保持相對同步(可能每 15 分鐘一次)。然後,對於虛擬機本身,我們使用 VMware 的 SRM。很酷的產品,我猜你聽說過。如果您願意,只需點擊一下按鈕,它幾乎可以抽象/自動化故障轉移到您的輔助數據中心。很光滑。

對我們來說幸運的是,我們在站點之間有一個 GigE 連結,我們將用於 SAN 複製(除其他外)。每 15 分鐘同步一次時,在我們的案例中,音量增量不會那麼大。根據您客戶的系統有多少攪動,通過 100Mbps 連結(甚至更小)保持同步可能並不難。我知道其他通過單個 T1 同步的 Compellent 客戶。顯然,那裡並沒有發生太多的數據變化……

無論如何,這裡有幾件事情需要考慮:

  • 小心你的交換 lun。它們很可能不需要被複製。當然,遠端的系統需要交換 lun,但您可以將這些虛擬機重新映射到僅限本地的 lun。這樣,您就無需擔心複製無用數據的成本。
  • 確保您的 SAN 供應商有一些故障恢復計劃。您不希望在故障轉移站點上執行幾個月的生產環境“卡住”,因為您不知道如何在主站點上恢復同步。
  • 這是不言而喻的,但測試,測試,測試。VMware SRM 使這變得非常容易執行,並且可以為您提供很好的故障轉移測試報告以送出給 PHB。
  • IP 定址。在我們的例子中,我們在站點之間執行 802.1QinQ,因此在故障轉移站點執行時重新定址伺服器將(幸運的是)沒有必要。但是,這確實需要來自每個站點的 BGP 廣告(具有適當的權重),以及在每個站點維護的防火牆規則,以便當流量轉向故障轉移站點時,事情會按預期工作。

這就是我現在的所有建議。六個月後,當我(希望)接近完成我們的 DR 系統時,我相信我會學到更多的東西。:) 祝好運並玩得開心點!

引用自:https://serverfault.com/questions/185264