Ubuntu

我的伺服器吐司了嗎?

  • April 29, 2013

昨晚我收到一封來自 mdadm 的電子郵件,內容是關於我的陣列上的兩個驅動器可能出現故障。RAID 陣列設置為 4 個 2TB 驅動器 raid5,帶有一個熱備用。這個系統真的炸了嗎?熱備件有沒有拾起任何東西,或者兩個驅動器是否同時出現故障?是否有一個驅動器出現故障,開始在備用驅動器上重建,然後導致另一個驅動器出現故障?我對突襲工作還很陌生,這個系統是我從以前的員工那裡繼承來的,所以我不確定這裡有哪些正確的故障排除步驟。任何幫助將非常感激。

cat /proc/mdstat 的輸出:

sudo cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10] 
md0 : active raid5 sdc[4](F) sdd[5](F) sda[6](S) sdb[0] sde[3]
     5860543488 blocks level 5, 64k chunk, algorithm 2 [4/2] [U__U]

mdadm –detail 的輸出:

#sudo mdadm --detail /dev/md0

/dev/md0:
       Version : 0.90
 Creation Time : Mon Jun 21 13:54:13 2010
    Raid Level : raid5
    Array Size : 5860543488 (5589.05 GiB 6001.20 GB)
 Used Dev Size : 1953514496 (1863.02 GiB 2000.40 GB)
  Raid Devices : 4
 Total Devices : 5
Preferred Minor : 0
   Persistence : Superblock is persistent

   Update Time : Mon Apr 29 10:52:27 2013
         State : clean, FAILED
Active Devices : 2
Working Devices : 3
Failed Devices : 2
 Spare Devices : 1

        Layout : left-symmetric
    Chunk Size : 64K

          UUID : 2874db80:a0f02d66:999df3c7:ff8f8e6e (local to host bigkahuna)
        Events : 0.10984

   Number   Major   Minor   RaidDevice State
      0       8       16        0      active sync   /dev/sdb
      1       0        0        1      removed
      2       0        0        2      removed
      3       8       64        3      active sync   /dev/sde

      4       8       32        -      faulty spare   /dev/sdc
      5       8       48        -      faulty spare   /dev/sdd
      6       8        0        -      spare   /dev/sda

如果日誌或 dmesg 中的驅動器上沒有 smartctl 錯誤。您可以嘗試重新組裝 RAID:

mdadm --assemble /dev/md0 --scan --force

引用自:https://serverfault.com/questions/503629