Hard-Drive

RAID 陣列中的故障磁碟 - 需要策略建議

  • September 29, 2016

我有一個基於 linux 的軟體 RAID 5 陣列。SMART 剛剛開始向我發送電子郵件,抱怨 5 個磁碟中的一個的目前待處理扇區計數為 9,並且離線不可糾正計數為 9。我已經做了很多Google搜尋,並且共識似乎是,如果我用零寫入扇區,磁碟將重新映射它們,一切都會好起來的。

我確實想追踪哪些文件受到了影響,但我很難進行映射,因為我在 RAID 5 中有 5 個磁碟,頂部有 LUKS 加密,最後是 LVM。我所做的任何研究都沒有幫助我解決這個問題。

最後,我的計劃是簡單地使驅動器發生故障並重新添加它以重新建構陣列。

在我這樣做之前,我對陣列中的另一個磁碟進行了“長時間”測試。除了重新分配的扇區數為 82,82,36,764 的那個之外,其他所有的都是完美的。

所以 5 個驅動器中有 2 個有問題。

在這一點上,如果可能的話,我對嘗試清除這些錯誤的最佳方法有點困惑。

有人有建議嗎?我很樂意在必要時更換故障驅動器,但想先嘗試獲取數據。

這將是一般過程。mdraid如果您還不知道要使用的確切命令,請參閱手冊頁和您自己的本地配置。

  1. 祈禱。
  2. 確認您的備份是最新的。必要時手動執行它。如果您沒有備份,請立即進行備份
  3. 使用掛起的扇區和離線不可糾正的扇區使驅動器失敗。具有重新分配扇區的另一個驅動器的壽命會更長一些,並且希望足夠長以完成此過程,但是該驅動器處於可能會殺死整個陣列的地步。
  4. 更換驅動器。在硬體方面。對新驅動器進行分區並將其添加到 mdraid 陣列中。
  5. 重建陣列並等待重建完成。在較新版本的 mdraid 中,重建將自動開始。
  6. 對第二個驅動器重複該過程。

引用自:https://serverfault.com/questions/470171