Debian

mdadm 增長操作給出不間斷的 libata 錯誤

  • November 14, 2013

執行 Debian 7,mdadm 3.2.5。我發出命令將 5 個磁碟、3 個備用 raid 5 陣列增長到一個 8 個磁碟、0 個備用 raid 6 陣列:

mdadm --grow /dev/md0 --level=6 --raid-devices=8 --backup-file=/root/raid5backup

驅動器啟動後一到五秒之間,會發出一點咔噠聲,然後它們停止,並且大量錯誤消息吐出到控制台。從這些消息中Google搜尋塊(每 1-5 秒有更多,所以我無法準確地得到它)最終讓我看到了這個 libata 錯誤消息細分頁面

根據該連結頁面,我的問題是“設備和主機之間的通信暫時失去,但又恢復了”。看起來像匯流排錯誤 - 可能是劣質電纜嗎?這台機器有 11 個 SATA 設備,6 個通過板載連接器和另外 5 個拆分在兩個擴展卡上。主機板是全新的。

我不確定如何處理這些消息。我應該關閉並嘗試更換電纜嗎?有任何想法嗎?

我的理論是驅動器的電源無法處理負載。當您發出增長命令時,陣列中的所有驅動器都必須開始實際工作。這會消耗更多的電量。電源無法供電,驅動器的電壓下降。一旦電壓變得太低,他們的電機會短暫關閉 - 當他們的頭部移動到安全位置時會發出咔噠聲,並且他們的邏輯控制器會失去與您的 SATA 控制器的通信 - 導致錯誤。當電機關閉時,電源上的負載降低,輸出電壓恢復到正常水平。因此驅動器重新啟動並重複循環。

您可以嘗試另一個電源,從系統中移除幾個驅動器(我知道這不容易)或移除其他來源或將它們移到外部(例如,可能將風扇連接到另一個電源。)或者,您可以嘗試重新平衡驅動器以與電源不同的電纜。(您還可以檢查電源的額定值和所連接設備的額定值,看看您是否在安全範圍內。)

引用自:https://serverfault.com/questions/554901