Software-Raid
軟體 RAID 10 陣列中的設備:乾淨,已降級。哎喲?
我在軟體 RAID 中有 4 個 500GB 驅動器。/dev/md0 是 RAID 1,掛載到 /boot /dev/md1 是 RAID 10,是交換 /dev/md2 是 RAID 10,是主系統和數據設備
我今天晚上看了 mdadm 並註意到 md2 ……
State : clean, degraded Number Major Minor RaidDevice State 0 8 3 0 active sync /dev/sda3 1 0 0 1 removed 2 8 35 2 active sync /dev/sdc3 3 8 51 3 active sync /dev/sdd3
檢查 md0 和 md1 所有驅動器都顯示為活動同步,設備狀態顯示為乾淨。
這是每個設備的 mdadm 的完整輸出以及 /proc/mdstat http://pastebin.com/VL0uYdU9的輸出
所以看起來 /dev/sdb1 和 /dev/sdb2 分別在 /dev/md0 和 /dev/md1 中執行。但是 /dev/sdb3 已從 /dev/md2 中退出(顯然已被刪除)
使用 RAID 10,我相信數據沒問題,除非我失去了鏡像另一側的另一個驅動器。我當然會備份到外部設備並已驗證這些設備是穩定的。
我做了一些日誌搜尋並註意到這對日誌行……
Dec 9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Currently unreadable (pending) sectors Dec 9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Offline uncorrectable sectors
每30分鐘重複一次。似乎這種情況已經有一段時間了,而且驅動器似乎未能通過 SMART 數據檢查。
1 月 7 日,一個白痴使用者重新啟動了伺服器,認為它可以解決郵件中繼問題。
這是來自 /var/log/messages 的啟動… http://pastebin.com/jGVsDD54
為什麼 /dev/sdb1 和 /dev/sdb2 似乎執行正常而只是 /dev/sdb3 失敗了?
只是碰巧在 sdb3 上的特定故障扇區?
是否值得嘗試將此分區重新添加到 md2 陣列?
還是我應該將驅動器裝箱並更換為新驅動器?
SMART 故障表示即將發生整體驅動器故障(但是,時間範圍無法預測);盡快更換此驅動器。