Raid

smartctl 實際上沒有執行自檢?

  • October 12, 2015

我想執行 smartctl 自檢來檢查我的 RAID 陣列 (PERC 5/i) 中驅動器的執行狀況。該陣列位於 sda 上,包含六個驅動器。我可以使用檢查狀態

sudo smartctl /dev/sda -d megaraid,0 -a

我看到 SMART 在所有驅動器上都可用並啟用。我嘗試使用

sudo smartctl /dev/sda -d megaraid,0 -t short

sudo smartctl /dev/sda -d megaraid,0 -t long

我還在所有驅動器 0-5 上嘗試過它。無論我嘗試什麼,當我執行時:

sudo smartctl /dev/sda -d megaraid,0 -l selftest

我總是得到相同的結果,這似乎總是報告我從未執行過自檢。

/dev/sda [megaraid_disk_00] [SAT]: Device open changed type from 'megaraid' to 'sat'
===START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

從我讀到的內容來看,在安裝陣列時,我應該沒有問題在陣列上執行短期和長期自檢。是否有其他人有在 PERC 5/i RAID 陣列上執行這些測試的經驗,可以深入了解導致問題的原因?

(smartmontools 5.40 版 2009 年 12 月 9 日 21:00:32 UTC)

這是戴爾 Perc 5/i 硬體陣列控制器。讓它做它的事。如果磁碟上沒有紅燈或黃燈,為什麼還要擔心執行自己的 S.MART測試?

除了其他功能/測試之外,陣列控制器還使用 SMART 來確定驅動器執行狀況。執行您自己的分析是不必要的。

這是一個舊執行緒,但讓我說硬體控制器,特別是巡邏讀取有很多不足之處。顯然他們應該測試磁碟表面並糾正問題,他們有時會這樣做,但他們從不修復表面上的未決扇區,而他們可以而且應該使用冗餘數據。因此,當您的硬碟驅動器出現智能錯誤並想要將其切換時,您無法真正知道另一個驅動器(例如在 raid1 中)是完全可讀的,因此需要進行智能長測試。是的…我同意一致性檢查可能會起作用,但這會降低陣列的性能,並且您會失去可以使用具有未發現或已知錯誤但仍具有 100% 可讀數據的最佳陣列保存的數據。關鍵是raid韌體有問題,內部工作被誇大了。

引用自:https://serverfault.com/questions/458896