Hardware-Raid
RAID 中的 HDD 故障,但掃描正常?
我的 Linux RAID 出現硬碟故障(閃爍紅燈)。我將其拔出並在重新啟動時被迫手動執行 fsck 並修復剩余文件系統中的一些錯誤。
我試圖找出一些關於它失敗的額外資訊並將其插入我的 Windows PC。當我插入它時,我收到一條消息,要求在磁碟管理器中對其進行初始化。我打算使用 CrystalDiskInfo 或 HDTune 來獲取 SMART 數據。它顯示為綠色,但在“報告的不可糾正錯誤”下的計數為 1。我決定對其進行格式化以獲取更多資訊。我做了完整的格式,不快,也沒有得到任何錯誤。
然後我載入了 HDTune 並進行了填充掃描,但沒有發現任何問題。我知道這個驅動器有很多時間,但我對這個問題的主體更感興趣。忽略時間,為什麼這個驅動器會在 RAID 中出現故障,但執行正常?
在這些掃描之後,是否有理由不將其恢復使用?
SMART 數據包含許多難以破譯的專有資訊。SMART 數據的問題在於,除非有“標記”的內容,否則幾乎不可能真正了解驅動器的實際情況。
發生故障的驅動器並不一定意味著它的 SMART 狀態會出現故障。
驅動器很可能開始出現正在重新分配的壞扇區,這會導致 RAID 出現計時問題。或者,RAID 驅動程序正在檢測其他問題 - 例如讀取失敗、寫入失敗或訪問/查找時間過長。
要回答您的問題,不,驅動器不應該被信任並且不應該返回服務。我曾多次親眼目睹過這種相同的行為,每次我將驅動器重新投入使用時,它都會在幾個月內再次被踢出。我不再那樣做了。
忽略任何接線問題或 RAID / SATA 控制器問題的可能性,驅動器被踢出,因為它有問題。驅動器很便宜,並且在生產系統中經常使用 RAID,因此不值得冒險失去兩個或更多驅動器和數據。