Central-Processing-Unit

雙 CPU 是否提供容錯功能?

  • July 10, 2012

假設我買了兩個 Intel Xeon 並將它們安裝到伺服器級硬體中……如果一個 CPU 發生故障,另一個 CPU 是否仍能正常工作並彌補不足,從而提供容錯功能?

這似乎不太可能,但我想我會問而不是做出任何假設。

在普通的雙插槽系統中,不會,儘管有些伺服器確實允許處理器和 RAM 的熱交換。所以這些東西確實存在,但它們處於非常非常高端的市場。

這並不是什麼大問題 - 在您的伺服器中可能出現故障的所有東西中,處理器都在列表的底部,旁邊是那些將主機板從機箱上固定下來的小黃銅立管。

談到 x86 商品硬體,如果系統正在執行並且 CPU 發生故障,事情將正常停止。但是,系統在重新啟動後會正常執行,儘管速度會慢一些。

多個 CPU 主要用於進行並行處理,而不是真正用於容錯。但是如果一個 CPU(或更多)出現故障,系統仍然可以啟動,這很好。

我會說你的 CPU 發生故障的可能性比 Mark Henderson 建議的要大,但它仍然不太可能。以我的經驗,這主要發生在系統經常過熱並自行關閉時(這在空調很差的辦公室伺服器機房中很容易)。CPU 不太喜歡這樣。

當然,如果您有一台不錯的 IBM 大型機或類似主機,那麼熱交換 CPU(板)就足夠“簡單”了。

引用自:https://serverfault.com/questions/363628