Memory
伺服器上的 EDAC 錯誤
我們的一台伺服器經常生成如下所示的錯誤消息:
kernel: EDAC MC1: 1 CE error on CPU#1Channel#0_DIMM#0 (channel:0 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
與大多數具有類似錯誤的問題不同,我的頁面和偏移值始終為 0x0。在這種情況下,壞的記憶棒也是問題嗎,或者這可能是其他硬體的問題?
根據伺服器的重要性,您基本上有兩個選擇:將 DIMM 換成另一個,然後檢查錯誤是否相應移動或盡快更換 DIMM。