Ubuntu

觸摸 ZFS 卷導致作業系統凍結,據報導驅動器正常

  • September 14, 2014

我剛拿到的 4 個全新的 3TB WD Red 驅動器存在大量問題。嘗試在 ubuntu 14.04.1 上使用“native zfs”和所有 4 個來設置 raidz2,這在我開始嘗試將數據複製到已安裝的捲之前一直有效。

我已經在所有 4 個驅動器上執行了 badblocks,一切都恢復正常。我已經在所有 4 個驅動器上執行了 SMART 擴展測試,一切正常。

認為idle3計時器可能會導致問題,因為我確實注意到驅動器經常進入睡眠狀態,即使我試圖將數據複製到它們(wtf?)所以我抓住了wd5741工具,如果我沒記錯的話不起作用,但 idle3-tools 成功阻止了驅動器進入待機狀態 - 永遠。

迄今為止,syslog 仍然報​​告錯誤,例如:

ata7.00: exception Emask 0x10 SAct 0x0 SErr 0x1910000 action 0xe frozen
ata7: SError: { PHYRdyChg Dispar LinkSeq TrStaTrns }
ata7.00: failed command: READ DMA

end_request: I/O error, dev sdc, sector 377981880

ata5.00: device reported invalid CHS sector 0

ata6.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
ata6.00: failed command: WRITE DMA EXT

對於所有 4 個卷,ata5-8 和 /dev/sdc-f 大約在訪問這些驅動器的程序開始鎖定時。

一旦這些驅動器鎖定,任何接觸它們的程序都會鎖定,即使只是嘗試列出卷的目錄內容(最近未列出)也會凍結。

只有 2 個驅動器報告了“WRITE DMA EXT”錯誤,但我懷疑這是因為設備“忙”(做一些我無法檢測或停止的事情)而不得不強制重置機器。

我檢查過的其他執行緒,大多數人正在更換驅動器以解決問題,但他們通過 SMART 檢查發現錯誤 - 我不是。

為了解決這個問題,我不得不銷毀並重新創建 ZFS 池大約 5 次。用最少的軟體重新安裝了一次 ubuntu 伺服器。

經過 2 天的努力後,想法很少。

更新:一夜之間將副本執行到 ZFS 池中,其中 2 個驅動器尚未出現任何寫入問題。它凍結了。我看不到它何時復製或複製了多少,因為當我嘗試執行lssudo mount幾乎任何東西時,我得到文件未找到錯誤。因此,除非核心認為解除安裝系統驅動器是個好主意,否則我會說我的 SATA 控制器或 borked,這意味著主機板可能正在退出。話雖如此,我今天早上確實發現它是至少有 5 年的歷史,其中 2 年是 24/7 執行的,所以可能是時候更換它了 :( 將在任何其他新聞中更新這篇文章。

原來我的 SATA 控制器肯定已經死了。我已經換掉了所有可能的東西,但即使在啟動時它偶爾也只是沒有檢測到驅動器已連接,所以很難指出其他任何東西。

感謝那些評論並試圖提供幫助的人:)

引用自:https://serverfault.com/questions/627487