Media

如何計算數據儲存設備損壞的機率?

  • August 29, 2009

有許多不同的儲存介質。僅舉幾例:

  • DVD
  • 光碟
  • 普通硬碟
  • SSD硬碟
  • USB 快閃記憶體棒

假設我已將一些文件保存到某個媒體。我將如何計算媒體/設備在 X 時間單位內損壞並且我將無法訪問內容的機率?

是否有任何好的資源可以為不同的設備和媒體類型提供此類統計數據和公式?

如果可能的話,我想要數字和公式。使用“使用兒子、父親和祖父類型的備份方案,其中祖父被複製並儲存在兩個不同的安全位置”可能確實是個好建議。但我希望能夠根據一些真實世界的統計數據計算設備/媒體發生故障的機率。

讓我們從硬碟開始。有三項很好的研究提供了足夠多有趣的真實世界統計數據: 卡內基梅隆大學、GoogleNetapp。具有某種意義的統計數據是年度故障率 (AFR),即驅動器在給定年份內發生故障的頻率。這些研究表明,一個不足為奇的結果是,製造商規格(如平均故障前時間)大大低估了一年內磁碟故障的可能性。這些數字因條件而異,我從中提取的經驗法則是,在具有良好設備的最佳條件下,您可能會達到 2% 的 AFR,但您應該期望最壞情況下的 AFR 接近 10%。

如果您有兩台設備具有相同數據的副本,並且它們的故障機率在統計上是獨立的,那麼您只需將百分比相乘即可得出兩者都發生故障的機會。例如,假設兩個硬碟驅動器的故障率為 5%(合理的中間值),那麼在給定的一年內您將同時失去這兩個硬碟的機率為 5% * 5% = 0.25%。現在,如果兩個驅動器都在同一個系統中,那麼兩個驅動器發生故障的機率要高得多——它們遠非獨立——所以這裡的實際機率在 5% 到 0.25% 之間;如果不深入了解控制器和電源故障等統計數據,就不可能比這更接近。有關更多範例和背景資訊,請參閱此處的標準 RAID 級別

回到你最初的問題,其他類型的媒體呢?儘管MTBF率已被證明是硬碟驅動器的一個非常樂觀的值,但對於許多其他媒體類型,這是您將找到的最佳評級。您可以使用線上可靠性計算器組合多個設備的 MTBF 或其近親 MTTF 。您可能能夠找到一些您正在考慮的其他媒體類型的真實世界研究,以幫助您找到更真實的 MTBF 數據,而不是使用製造商的數字。

引用自:https://serverfault.com/questions/60326