伺服器使用率以及如何處理數據中心故障

July 31, 2015

Docker、Mesos、Kubernetes 等新技術可以在組織中實現更好的伺服器使用率。但是，考慮到整個數據中心的故障，我想知道如何最大限度地提高兩個數據中心的使用率。
鑑於這種情況：
具有相等計算資源的兩個數據中心（DC-A 和 DC-B）。兩個數據中心都以負載平衡/循環方式執行和服務請求。兩個數據中心的伺服器使用率均為 80%。
假設 DC-B 發生故障（物理或網路）並且無法訪問。DC-A 將無法再增加 80% 的使用率，因為它本身已經達到 80%。讓組織處於潛在的 DC-A 將無法處理額外需求並導致中斷的狀態……
這是否意味著兩個數據中心（DC-A 和 DC-B）的組織每個數據中心的最大使用率只能達到 50%？即，任何一個 DC 發生故障，另一個 DC 將能夠彌補另一個 DC 的不足 (50% + 50%)。
這種想法正確嗎？其他人如何處理這個問題或者我錯過了什麼？

對於需要始終可用的服務，您需要 N+1 冗餘，其中 N 是處理負載所需的數據中心或伺服器（或您在建議的故障場景中失去的任何其他東西）的數量。這會變得更便宜 - 在低端有兩個數據中心，每個數據中心都需要能夠處理整個工作負載。但是如果你有 10 個，他們可以做 9 個的工作，但仍然是多餘的。
另一種選擇是減載，儘管該片語更常用於電力系統。基本上，在發生故障的情況下關閉所有非必要的服務，以便剩餘系統有足夠的資源。

引用自：https://serverfault.com/questions/709925

相關問答

如何保護 docker 主機不允許生根

June 2, 2016

當一個 initContainer 被 OOMKilled 時，Pod 卡在 PodInitializing 狀態

August 30, 2022

使用 KubeVirt 的案例和好處是什麼

August 6, 2022

無法在 Kubernetes 中正確編輯和保存工作節點規範

August 6, 2022

Azure 無法將磁碟附加到 VM

July 13, 2022

服務在 Pod 網路中的 Pod 內執行

June 24, 2022