Ssd

平均故障間隔時間 – SSD

  • July 23, 2019

SSD的平均故障間隔時間(MTBF)以小時數列出。1,500,000

那是很多小時。1,500,000小時大約是170幾年。由於這種特殊 SSD 的發明是在內戰之後,他們怎麼知道 MTBF 是什麼?

幾個對我有意義的選擇:

  • 新蛋只是一個錯字
  • 平均故障間隔時間的定義不是我想的那樣
  • 他們正在使用某種類型的統計推斷來估計 MTBF 將是多少

問題:

如何獲得 SSD/HDD 的平均故障間隔時間 (MTFB)?

驅動器製造商根據兩個相關指標指定其產品的可靠性:年化故障率 (AFR),即在按每年估算的測試中失敗的磁碟驅動器在總體中的百分比;和平均無故障時間 (MTTF)。

新產品的 AFR 通常基於加速壽命和壓力測試或基於早期產品的現場數據進行估算。MTTF 估計為每年的通電小時數除以 AFR。伺服器中驅動器的一個常見假設是它們 100% 的時間都處於通電狀態。

http://www.cs.cmu.edu/~bianca/fast/

150 萬小時的 MTTF 聽起來有些合理。

這大概是一個測試,1000 個驅動器執行 6 個月,3 個驅動器出現故障。

AFR 為 (2* 6 個月 * 3)/(1000 個驅動器)=0.6% 每年,MTTF = 1 年/0.6%=1,460,967 小時或 167 年。

查看該數字的另一種方法是,當您擁有 167 個驅動器並讓它們執行一年時,製造商聲稱您平均會看到一個驅動器出現故障。

但我希望這只是恆定的“隨機”機械/電子故障率。

假設故障率遵循浴缸曲線,如評論中所述,製造商的行銷團隊可以稍微調整可靠性數字,例如不包括 DOA’S(到達時死亡,通過質量控制但最終使用者失敗的單元安裝它們)並擴展 DOA 定義以排除早期故障峰值中的那些。而且由於測試的執行時間不夠長,您也不會看到年齡影響。

我認為保修期可以更好地表明製造商真正期望 SSD 可以使用多長時間!

這絕對不會用幾十年或幾個世紀來衡量……


與 MTBF 相關的是與 NAND 單元可以支持的有限寫入周期數相關的可靠性。一個常見的指標是總寫入容量,通常以 TB 為單位。除了其他性能要求之外,這是一大限制因素。

為了更方便地比較不同品牌和不同大小的驅動器,寫入耐久性通常轉換為每日寫入容量,作為磁碟容量的一小部分。

假設驅動器在保修期內的額定壽命:

100 GB SSD 可能有 3 年保修期和 50 TB 寫入容量:

        50 TB
---------------------  = 0.46 drive per day write capacity.
3 * 365 days * 100 GB

該數字越高,磁碟越適合寫入密集型 IO。

目前(2014 年底)價值伺服器線 SSD 的價值為 0.3-0.8 驅動器/天,中端從 1-5 穩步增長,高端似乎飆升,寫入耐久性水平高達 25 *每天的驅動能力3-5年。

一些現實世界的測試 表明,有時可能會大大超出供應商的要求,但驅動設備超出供應商限制並不總是企業考慮…而是為您的目的購買正確規格的驅動器。

引用自:https://serverfault.com/questions/641726