Raid

硬碟上的位腐爛是一個真正的問題嗎?可以做些什麼呢?

  • September 20, 2020

一位朋友正在和我談論位腐爛的問題 - 驅動器上的位隨機翻轉,破壞數據。非常罕見,但如果有足夠的時間,它可能會成為一個問題,而且無法檢測到。

驅動器不會認為它是壞扇區,備份只會認為文件已更改。驗證完整性不涉及校驗和。即使在 RAID 設置中,也會檢測到差異,但無法知道哪個鏡像副本是正確的。

這是一個真正的問題嗎?如果是這樣,可以做些什麼呢?我的朋友推薦 zfs 作為解決方案,但我無法想像在工作中扁平化我們的文件伺服器,安裝 Solaris 和 zfs..

首先:您的文件系統可能沒有校驗和,但您的硬碟驅動器本身有它們。例如,SMART。當然,一旦翻轉了太多位,錯誤就無法糾正。如果你真的很不走運,位可能會以這樣一種方式發生變化,以至於校驗和不會變得無效;那麼甚至不會檢測到錯誤。因此,可能會發生令人討厭的事情;但是聲稱隨機位翻轉會立即破壞您的數據是虛假的。

但是,是的,當您將數万億位放入硬碟驅動器時,它們不會永遠保持這種狀態。這是一個真正的問題!ZFS 可以在每次讀取數據時進行完整性檢查;這類似於您的硬碟驅動器本身已經做的事情,但它是您犧牲一些空間的另一種保護措施,因此您正在提高對數據損壞的恢復能力。

當您的文件系統足夠好時,發生錯誤但未被檢測到的可能性會變得非常低,以至於您不必再關心它,您可能會決定將校驗和內置到您正在使用的數據儲存格式中不必要。

無論哪種方式:不,並非不可能檢測到.

但是文件系統本身並不能保證每次故障都可以恢復。這不是靈丹妙藥。您仍然必須有備份和計劃/算法,以便在檢測到錯誤時做什麼。

引用自:https://serverfault.com/questions/77710