Linux

“GHES:HEST 未啟用!”的含義在 dmesg

  • August 17, 2017

重新啟動 SuSE 12 主機後,我查看dmesg並發現了資訊

   GHES: HEST is not enabled!

GHES 顯然意味著“APEI 通用硬體錯誤源支持”。是否應該啟用 GHES/HEST?它的好處是什麼?如何實現這一點,如果它是可取的?

我有幾台 SLES 機器正在生產中,但從未使用過。這是一個很好的概述:https ://firmware.intel.com/sites/default/files/resources/A_Tour_beyond_BIOS_Implementing_APEI_with_UEFI_White_Paper.pdf

硬體錯誤源表 (HEST) HEST 表使主機韌體能夠聲明平台組件可以生成的所有錯誤並為這些錯誤發出錯誤信號。主機韌體應在 HEST 中為每個組件(例如,處理器、PCIe 設備、PCIe 橋等)和每種類型的錯誤創建錯誤源條目,並帶有相應的錯誤通知機制(單選)到 OS。這些錯誤條目包括 x86 架構錯誤、行業標準錯誤和平台錯誤的通用硬體錯誤源。x86 架構錯誤、MCE 和 CMC 以及標準錯誤 PCIe AER、MSI 和 PCI INTx 可以由作業系統本地處理。通用硬體錯誤源可用於所有沒有 OS 本機信號的韌體 1st 錯誤和平台錯誤(例如記憶體、板邏輯),

我想如果你真的想監控所有的硬體錯誤,這可能很有用。

引用自:https://serverfault.com/questions/869102