Datacenter

伺服器使用率以及如何處理數據中心故障

  • July 31, 2015

Docker、Mesos、Kubernetes 等新技術可以在組織中實現更好的伺服器使用率。但是,考慮到整個數據中心的故障,我想知道如何最大限度地提高兩個數據中心的使用率。

鑑於這種情況:

具有相等計算資源的兩個數據中心(DC-A 和 DC-B)。兩個數據中心都以負載平衡/循環方式執行和服務請求。兩個數據中心的伺服器使用率均為 80%。

假設 DC-B 發生故障(物理或網路)並且無法訪問。DC-A 將無法再增加 80% 的使用率,因為它本身已經達到 80%。讓組織處於潛在的 DC-A 將無法處理額外需求並導致中斷的狀態……

這是否意味著兩個數據中心(DC-A 和 DC-B)的組織每個數據中心的最大使用率只能達到 50%?即,任何一個 DC 發生故障,另一個 DC 將能夠彌補另一個 DC 的不足 (50% + 50%)。

這種想法正確嗎?其他人如何處理這個問題或者我錯過了什麼?

對於需要始終可用的服務,您需要 N+1 冗餘,其中 N 是處理負載所需的數據中心或伺服器(或您在建議的故障場景中失去的任何其他東西)的數量。這會變得更便宜 - 在低端有兩個數據中心,每個數據中心都需要能夠處理整個工作負載。但是如果你有 10 個,他們可以做 9 個的工作,但仍然是多餘的。

另一種選擇是減載,儘管該片語更常用於電力系統。基本上,在發生故障的情況下關閉所有非必要的服務,以便剩餘系統有足夠的資源。

引用自:https://serverfault.com/questions/709925