Software-Raid

軟體 RAID 10 陣列中的設備:乾淨,已降級。哎喲?

  • January 14, 2013

我在軟體 RAID 中有 4 個 500GB 驅動器。/dev/md0 是 RAID 1,掛載到 /boot /dev/md1 是 RAID 10,是交換 /dev/md2 是 RAID 10,是主系統和數據設備

我今天晚上看了 mdadm 並註意到 md2 ……

State : clean, degraded
Number   Major   Minor   RaidDevice State
0       8        3        0      active sync   /dev/sda3
1       0        0        1      removed
2       8       35        2      active sync   /dev/sdc3
3       8       51        3      active sync   /dev/sdd3

檢查 md0 和 md1 所有驅動器都顯示為活動同步,設備狀態顯示為乾淨。

這是每個設備的 mdadm 的完整輸出以及 /proc/mdstat http://pastebin.com/VL0uYdU9的輸出

所以看起來 /dev/sdb1 和 /dev/sdb2 分別在 /dev/md0 和 /dev/md1 中執行。但是 /dev/sdb3 已從 /dev/md2 中退出(顯然已被刪除)

使用 RAID 10,我相信數據沒問題,除非我失去了鏡像另一側的另一個驅動器。我當然會備份到外部設備並已驗證這些設備是穩定的。

我做了一些日誌搜尋並註意到這對日誌行……

Dec  9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Currently unreadable (pending) sectors
Dec  9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Offline uncorrectable sectors

每30分鐘重複一次。似乎這種情況已經有一段時間了,而且驅動器似乎未能通過 SMART 數據檢查。

1 月 7 日,一個白痴使用者重新啟動了伺服器,認為它可以解決郵件中繼問題。

這是來自 /var/log/messages 的啟動… http://pastebin.com/jGVsDD54

為什麼 /dev/sdb1 和 /dev/sdb2 似乎執行正常而只是 /dev/sdb3 失敗了?

只是碰巧在 sdb3 上的特定故障扇區?

是否值得嘗試將此分區重新添加到 md2 陣列?

還是我應該將驅動器裝箱並更換為新驅動器?

SMART 故障表示即將發生整體驅動器故障(但是,時間範圍無法預測);盡快更換此驅動器。

引用自:https://serverfault.com/questions/468826