Ubuntu

分析損壞磁碟的 SMART 自檢

  • November 4, 2014

我最近從假期回到家,只是醒來後發現我的 RAID5 陣列中有兩個磁碟被標記為故障。我能夠通過強制它使用有故障的磁碟並執行來啟動 RAID,並且我能夠挽救我擁有的一些重要數據。

由於某種原因,伺服器正在執行,並且不允許我在 sudo 或 su 下執行命令,所以我決定重新啟動。一旦我做了驅動器更改名稱,所以現在我不知道哪些是原來的故障驅動器。

現在我正在嘗試確定哪些磁碟是壞的,以便我可以更換它們,但這並不是一件容易的事。所有磁碟仍在執行,但至少有兩個我確定我不希望在我的新 RAID 中。我希望你們都可以在這裡幫助我。

我已經在所有沒有拋出任何錯誤的磁碟上執行了 badblocks,但是 smartctl 確實給了我一些關於磁碟的有趣資訊,但我真的不知道該怎麼做。

以下是最近更新的日誌文件。

最新測試在 LATEST 下標記為日期 (03/11/2014)。

我只能發布兩個連結,所以這是其他連結…

/dev/sdd: http://paste.ubuntu.com/8808126/
/dev/sde: http://paste.ubuntu.com/8808128/

提前致謝

喬納森

/dev/sda並且/dev/sdd失敗了。未能通過擴展自檢的驅動器基本上隨時都會出現故障。驅動器的自檢非常簡單,因此那裡的故障表明您應該立即更換驅動器。

此外,看起來驅動器過去過熱,所以我建議檢查伺服器的氣流。

引用自:https://serverfault.com/questions/641749