Hard-Drive
RAID 陣列中的故障磁碟 - 需要策略建議
我有一個基於 linux 的軟體 RAID 5 陣列。SMART 剛剛開始向我發送電子郵件,抱怨 5 個磁碟中的一個的目前待處理扇區計數為 9,並且離線不可糾正計數為 9。我已經做了很多Google搜尋,並且共識似乎是,如果我用零寫入扇區,磁碟將重新映射它們,一切都會好起來的。
我確實想追踪哪些文件受到了影響,但我很難進行映射,因為我在 RAID 5 中有 5 個磁碟,頂部有 LUKS 加密,最後是 LVM。我所做的任何研究都沒有幫助我解決這個問題。
最後,我的計劃是簡單地使驅動器發生故障並重新添加它以重新建構陣列。
在我這樣做之前,我對陣列中的另一個磁碟進行了“長時間”測試。除了重新分配的扇區數為 82,82,36,764 的那個之外,其他所有的都是完美的。
所以 5 個驅動器中有 2 個有問題。
在這一點上,如果可能的話,我對嘗試清除這些錯誤的最佳方法有點困惑。
有人有建議嗎?我很樂意在必要時更換故障驅動器,但想先嘗試獲取數據。
這將是一般過程。
mdraid
如果您還不知道要使用的確切命令,請參閱手冊頁和您自己的本地配置。
- 祈禱。
- 確認您的備份是最新的。必要時手動執行它。如果您沒有備份,請立即進行備份。
- 使用掛起的扇區和離線不可糾正的扇區使驅動器失敗。具有重新分配扇區的另一個驅動器的壽命會更長一些,並且希望足夠長以完成此過程,但是該驅動器處於可能會殺死整個陣列的地步。
- 更換驅動器。在硬體方面。對新驅動器進行分區並將其添加到 mdraid 陣列中。
- 重建陣列並等待重建完成。在較新版本的 mdraid 中,重建將自動開始。
- 對第二個驅動器重複該過程。