Linux

RAID 磁碟問題後啟動 CentOS 5 時出錯

  • October 28, 2016

我有一個在IBM X3850 X5 type 7143盒子上執行的 linux 設備。中央作業系統 5。

它具有 6 個驅動器的 RAID 5 配置。2 個驅動器出現故障。一個壞了,需要更換。另一個剛剛離線並重新線上。

備份離線驅動器後,陣列恢復聯機,此時我們更換了另一個驅動器,以便它可以重建。此時,所有驅動器都顯示為線上,並且 RAID 陣列在 MegaRAID BIOS 中顯示為健康狀態。

儘管如此,當我嘗試啟動 CentOS 時,我仍然遇到錯誤。具體來說,我看到:

Loading dm-message.ko module
Loading dm-raid45.ko module
device-mapper: dm-raid45: initialized v0.25941    
Waiting for driver initialization.
Scanning and configuring dmraid supported devices
Creating root device.
Mounting root filesystem.
kjournald starting.  Commit interval 5 seconds. 
EXT3-fs: mounted filesystem with ordered data mod. 
Setting up other filesystems.
Setting up new root fs
setuproot: moving /dev failed: No such file or directory
no fstab.sys, mounting internal defaults
setuproot: error mounting /proc: No such file or directory 
setuproot: error mounting /sys: No such file or directory
Switching to new root and running init. 
unmounting old /dev
unmounting old /proc
unmounting old /sys
ERROR opening /dev/console: No such file or directory
Trying to use fd 0 instead
WARNING: can't access (null)
exec of init ((null)) failed!!!: Bad address
Kernel panic - not syncing: Attempting to kill init!

關於這裡可能發生的事情以及如何解決它的任何想法?我不確定如果成功重建 RAID 陣列,為什麼 CentOS 會出現問題。

您的初始 ramdisk 無法根樞軸,因為您的根設備上有文件系統錯誤。

您的陣列存在一致性問題,因為它已損壞,而不僅僅是在某一時刻降級。現在您已經通過重新同步在整個陣列中傳播了這些文件系統的不一致性(實際上,您對此無能為力),您需要在文件系統級別修復它們。

對您的根文件系統以及駐留在此陣列上的任何其他文件系統執行離線 fsck。您可能不得不依靠備份來恢復您的機器。這是 RAID 10 在 RAID 5 或 6 上勝出的眾多原因之一,也是 5 和 6 的採用率遠低於以往的原因。話雖如此,RAID 絕不是備份,無論 RAID 級別如何,損壞的陣列上都會有損壞的文件系統。

引用自:https://serverfault.com/questions/811982