Memory

戴爾 Power Edge 2950 - E211 SBE LOG DISABLE DIMM6

  • July 12, 2013

知道這個錯誤E211 SBE LOG DISABLE DIMM6可能意味著什麼嗎?有人經歷過嗎?

我知道這聽起來很明顯,那是我記憶中的第 6 行,請客:

  • 我已經更改了 RAM 模組的順序。同一 DIMM 插槽上的相同錯誤
  • 戴爾已經用新的 MOBO 替換了 MOBO。RAM 模組以不同的順序連接,相同的錯誤。已經使用 OMSA livecd 清理了日誌。
  • 啟動到 memtest+ 什麼都不顯示
  • 此主機板上所有可能的韌體都是最新的

可能是另一個組件或韌體問題?

戴爾也在查看,但在 OMSA 創建的系統日誌中一無所獲。

一個明顯的症狀是,錯誤在執行一小時後開始。此硬體上的作業系統是 ESXi 5.0.1。由於此錯誤,沒有導致系統崩潰。

**編輯:**我已經通過/opt/dell/dset/clearesm.sh新主機板上的(OMSA liveCD)清理了bios日誌,重新啟動到memtest +(仍然在livecd上),20分鐘後顯示器打開錯誤消息並且memtest沒有發現錯誤……

編輯 2: ./dcicfg32 command=clearmemfailures Bios 上的 BCM 都沒有清除(在文章中控制 + E -> 系統事件日誌菜單 -> 清除系統事件日誌)似乎解決了這個問題。執行 20 分鐘後,錯誤再次出現。

編輯 3: MOBO 已更改(見上文)並且兩者都有/有相同的錯誤。交換記憶體位置或使用其他2950伺服器的記憶體沒有變化就報錯。

這表明在 DIMM 6 上發生了單位錯誤 (SBE),其頻率如此之高,以至於系統在重新啟動之前不再記錄錯誤。(有關背景資訊,請參閱https://support.quest.com/SolutionDetail.aspx?id=SOL60022。)

更換主機板後看到同樣的錯誤有點令人困惑,但更換主機板可能與第一塊主機板有相同的缺陷。由於您移動了 DIMM,並且問題並未出現在 DIMM 上,因此我不太可能懷疑 DIMM。

我會為該伺服器使用適當的 Dell MpMemory 診斷程序,而不是 memtest+。戴爾工具將了解任何戴爾特定的硬體功能。

引用自:https://serverfault.com/questions/521737