Hardware

確定 SSD 驅動器健康狀況的快速方法?

  • April 6, 2020

我有一個 Intel X-25M 驅動器,它在 ZFS 儲存陣列中被​​標記為“失敗”兩次,如此所述。但是,卸下驅動器後,它似乎可以在其他電腦(Mac、PC、USB 外殼等)中進行掛載、讀寫

有沒有確定驅動器目前執行狀況的好方法?感覺之前ZFS方案的失敗是bug的匯聚,錯誤的報錯和硬體的融合。不過,似乎這個驅動器可能有一些生命。

檢查任何驅動器執行狀況的一種很好但並非絕對可靠的方法是檢查 SMART 屬性。

下面是使用smartctl v5.41 為 Intel X25-M G2 160GB 磁碟設置的 SMART 屬性。(版本很重要,smartctl 的早期版本具有不同的屬性名稱映射,實際上並沒有正確理解該驅動器的特定表)。

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
 3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
 4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
 5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
 9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

這表明驅動器有 1 個重新分配的扇區,使用了 1% 的可用保留空間(屬性 232)和 2% 的預計程式/擦除週期(屬性 233)。它已寫入 148418 * 32MiB(屬性 225)。

如果驅動器顯示大量重新分配的扇區,則可能會引起關注,因為這可能表明快閃記憶體晶片出現故障(就像旋轉磁碟上大量重新分配的扇區通常指向表面錯誤一樣)。端到端也很糟糕 - 我有一些 X25-M G2 160GB 磁碟因大 (>1000) 端到端錯誤報告而失敗。但是,這些磁碟實際上只有兩個有用的錯誤條件屬性,因為普通磁碟的大多數有用的 SMART 屬性不適用於 SSD。

但是,SMART 通常不被認為是 100% 可靠的。Google 對磁碟故障的研究發現,雖然各種 SMART 預警指標與驅動器故障之間存在良好的相關性,但它並不是預測單個驅動器故障的有用工具。出於這個原因,我通常使用 SMART 來證明驅動器是壞的(如果出現錯誤,它可能很快就會出現故障),而不是證明驅動器仍然是好的。

引用自:https://serverfault.com/questions/282301