Replication

託管故障轉移(代理?)服務 - 它存在嗎?

  • July 7, 2012

我們正處於規劃階段,以使我們的 Web 應用程序服務變得多餘。現在,我們在託管地擁有自己的物理伺服器,執行連接到 EqualLogic SAN 的 VMWare 集群。這是一個 LAMP 設置。我們想設置第二個站點,用於負載平衡或作為主動/被動故障轉移(我認為我們一直傾向於後者,但尚未做出決定)。

在繪圖板上,我們想出了一個我們認為簡單的解決方案。ourdomain.com 解析為 1.2.3.4,它是負載均衡器、故障轉移服務或類似 apache 的反向代理的 IP 地址。請求進入它並將請求轉發到適當的數據中心。這樣,如果數據中心 A 出現故障,我們只需更改負載均衡器以將所有請求發送到數據中心 B。

我們未能找到提供此類服務的任何人。我們詢問過的每個人(比如 X0 和 L3)都說他們真的不知道我們是否會找到類似的東西。我們的最終目標是在兩個站點之間實現冗餘,以最大限度地減少停機時間,無論是硬體故障還是整個數據中心因自然災害而離線。我們向各種供應商描述了這種設置,沒有人熟悉任何此類服務。

我們遇到的最好的想法是使用故障轉移 DNS。我們目前使用 dnsmadeeasy.com,如果他們的監控器檢測到站點 A 已關閉,他們將更改 DNS 以解析到站點 B 的 IP。我們已經進行了一些測試,即使我們的 TTL 為 1 分鐘,也需要DNS 伺服器平均需要大約 15 分鐘來獲得更改,而我們在海外查詢的一些 DNS 提供商(例如對我們很重要的澳大利亞)花了將近一個小時來進行更改。這還不夠好。

那麼我錯過了什麼?

  • 是否存在託管故障轉移解決方案?為什麼所有這些大牌公司都表現得好像他們以前從未聽說過這樣的概念,而它似乎應該相當普遍?
  • mod_proxy 對我們有用嗎?如果是這樣,你可以設置一個 apache 伺服器集群來做 mod_proxy,這樣 IT 就不會成為單點故障嗎?
  • 您可以建議針對冗餘站點的更好解決方案嗎?

要回答您的問題:

  • 是的,存在託管故障轉移解決方案。它通常不提供或宣傳,因為它不是一個常見的要求。冗餘站點的成本,加上正確執行任何類型的 GLB 的成本確實非常昂貴。通常,當我們告訴客戶它將是多少時,他們會有點臉色蒼白,突然之間,他們可以忍受比之前預期的多一點的停機時間。
  • 我不會使用 Apache,但你可以使用某種代理平衡器來做到這一點。問題是您還需要使其地理上分佈——並且由於您的代理增加延遲,您需要確保它們在離您的客戶非常近的地方可用,以最大限度地減少延遲損失。Google和 Akamai 試圖確保他們有幾架工具包非常靠近大型 ISP(最好是位於其中),這是有原因的。
  • 而不是代理,我只是使用 BGP 故障轉移來提供主動-被動,使用 GLB-DNS 來提供多主動以獲得最佳性能(沒有必要讓第二個設施在每 1576800 分鐘中無所事事 1576785 分鐘——你也可以從中獲得一些持續的好處)。

就個人而言,我建議您深吸一口氣,認真考慮是否真的需要接近零停機時間的地理冗餘。真的,你在這裡做什麼會讓你因為 15 分鐘的中斷而損失 200 萬美元以上?因為這是您正在尋找的那種每次中斷事件的成本,以提供這種基礎設施的基本形式(假設您使用的是不會經常停機的良好設施)。在設置這樣的東西並保持其執行所需的工程工作與重新設計應用程序以使其正常工作所涉及的成本之間在這種分佈式環境中,您將為此投入大量資金,並且維持它將是一個持續不斷的成本(想想您將無法使用的所有功能)實施,因為它不能在多個站點上正常工作,更不用說執行所有額外基礎設施的每月成本了)。

引用自:https://serverfault.com/questions/405525