Mdadm

為什麼 md 數組重建開始?

  • July 5, 2022

我最近mdadm對這些事件進行了報告,昨天我收到了一些重建事件。為什麼開始重建?我在期刊上沒有看到任何相關的內容。我還擔心“發現不匹配:128(在突襲級別 1)”部分。這是什麼意思?我正在執行 Ubuntu 20.04.1 LTS。

關於研究工作,我檢查了手冊頁。它說:

RebuildStarted

一個 md 陣列開始重建(例如恢復、重新同步、重塑、檢查、修復)。(系統日誌優先級:警告)

好吧,這可能意味著很多事情,所以……在我的情況下是什麼?是什麼原因造成的?我嘗試用​​Google搜尋原因,但找不到任何東西。即使現在知道我找不到任何資訊的原因。

這不是重建,而是檢查

     [>....................]  check =  0.0% (2816/33520640) finish=197.2min speed=2816K/sec

Debian(我想,Ubuntu 作為衍生產品)安裝了一個 cron 作業,每月檢查一次所有陣列。

這就是清理——監控和維護 RAID 的重要組成部分。它確保各種由 BER 引起的錯誤不會損壞您的數據(或者,至少,您會更快地知道這種損壞,並且您將能夠採取措施來緩解)。它還允許及早檢測故障設備。這是 A Goog Thing™。

MD 讀取兩個驅動器並確保它們包含相同的數據。或者,在更複雜的 RAID 級別的情況下,它會讀取所有驅動器並檢查奇偶校驗綜合症是否匹配。如果出現問題,它會嘗試糾正並警告您。例如,不匹配是兩種媒體之間的這些意想不到的差異。如果您經常注意到它們,這就是徹底檢查您的儲存的原因。可能您需要在插槽中重新安裝一些電纜或 SSD,甚至更換它們。

順便說一句,硬體 RAID 和大型 SAN 系統也在後台實現了這種一致性檢查。

引用自:https://serverfault.com/questions/1104737