Kernel-Panic

在 Hetzner 上升級到 Centos Stream 會導致核心崩潰

  • April 7, 2022

我有幾台 Hetzner AX 和 EX 系列(AMD 和 Intel)的伺服器,我用 Centos 8 安裝,然後遷移到 Centos Stream,但每次嘗試使用 Stream 中的任何圖像引導時都會出現核心恐慌。

當然,除了聲稱沒有已知問題(HA!)之外,它們對潛在核心配置的建議並不是很有幫助。由於它甚至沒有進入日誌記錄,我非常無助。

我已經在各種 PC 上完成了 10 次到 Stream 的遷移,但我只遇到了 HZ 伺服器的問題。

有人對此有任何想法嗎?

機器人截圖

錯誤發生在amd64_edac_mod模組中。

您可以通過將模組添加到模組黑名單來禁用該模組

瀏覽器/etc/modprobe.d/edac_blacklist.conf

blacklist amd64_edac_mod

然後嘗試重新啟動並查看問題是否再次出現。

這會禁用對 ECC 記憶體的機器檢查異常支持,並且可能會阻止知道是否發生了 ECC 錯誤。

鑑於這發生在多個 hetzner 主機上,它可能是與主機板或板上的記憶體控制單元有關的軟體錯誤。

較新的核心實際上可能會修復它,但我懷疑將模組列入黑名單應該可以防止出現恐慌。

任何仍然線上但已載入但未死亡的主機,您可能也可以使用modprobe -r該模組來防止出現問題,但我建議首先在不重要的主機上進行測試。

引用自:https://serverfault.com/questions/1098039