Linux

SMART 警告我,但我不相信

  • February 18, 2010

我有一台帶有四個三星硬碟的伺服器。所有驅動器都是同一型號,並且是一起購買的。驅動器為 SAMSUNG HE753LJ,韌體為 1AA01113。

我收到 SMART 錯誤,但我覺得 smartctl 不了解他從硬碟驅動器中獲得的價值。

這是 SMART 測試的結果:

asgard:~# smartctl -H /dev/sdb
smartctl 版本 5.38 [i686-pc-linux-gnu] 版權所有 (C) 2002-8 Bruce Allen
首頁是 http://smartmontools.sourceforge.net/

=== 開始讀取智能數據部分 ===
SMART 整體健康自我評估測試結果:失敗!
預計驅動器故障會在 24 小時內發生。保存所有數據。
失敗屬性:
ID# ATTRIBUTE_NAME 標誌值最壞門檻值類型在 WHEN_FAILED RAW_VALUE 時更新
3 Spin_Up_Time 0x0007 001 001 011 故障前 始終 FAILING_NOW 60340

我不信任 SMART,因為:

  • 一年多來,所有磁碟都將在不到 24 小時內發生故障。還沒有爆炸。
  • 維基百科說“ Spin-Up Time 是主軸旋轉的平均時間(從零轉速到完全執行$$ millisecs $$)。“這意味著驅動器需要大約一分鐘才能喚醒?!

我想听從 smartctl 的建議並更改這些磁碟,但我只是不相信我讀到的結果。

你怎麼看待這件事?你會怎麼做?

謝謝你的幫助。

所有驅動器都是同一型號,並且是一起購買的。

這是一個定時炸彈。

根據 SMART 的消息和上面的報價,您應該立即更換磁碟。

由於驅動器是一起購買的並且型號相同,因此它們可能具有相同的弱點,並且可能在相同的條件下同時發生故障…

RAID 的主要概念是磁碟在不同時間發生故障,讓您有機會一次交換一個磁碟,並避免數據失去。

其他人報告說,RAID 配置中的整個相同磁碟陣列同時發生故障,來自同一生產批次,因此受到相同的弱點。

我怎麼強調都不為過:您需要開始更換驅動器!

引用自:https://serverfault.com/questions/114196