Hard-Drive

我應該如何在硬碟中刻錄?

  • July 3, 2020

Google對硬碟故障進行了非常徹底的研究,發現很大一部分硬碟在大量使用的前 3 個月內出現故障。

我的同事和我認為我們可以為所有新硬碟實施老化過程,這可能會為我們節省一些心痛,以免浪費時間在新的、未經測試的驅動器上。但在我們實施老化過程之前,我們希望從其他更有經驗的人那裡獲得一些見解:

  • 在開始使用硬碟之前刻錄硬碟有多重要?

  • 您如何實施老化過程?

    • 你在硬碟中刻錄多長時間?
    • 你用什麼軟體來刻錄驅動器?
  • 對於老化過程來說,多少壓力太大了?

編輯:由於業務的性質,大部分時間都無法使用 RAID。我們必須依靠在全國范圍內頻繁郵寄的單個驅動器。我們會盡快備份驅動器,但在我們有機會備份數據之前,我們仍然會時不時地遇到故障。

更新

我的公司已經實施了一段時間的老化過程,事實證明它非常有用。我們立即燒錄所有庫存的新驅動器,使我們能夠在保修到期之前和將它們安裝到新的電腦系統之前發現許多錯誤。驗證驅動器是否壞了也被證明是有用的。當我們的一台電腦開始遇到錯誤並且硬碟驅動器是主要嫌疑人時,我們將在該驅動器上重新執行老化過程並查看任何錯誤以確保驅動器確實是問題,然後再開始 RMA 過程或拋出它在垃圾桶裡。

我們的老化過程很簡單。我們有一個帶有大量 SATA 埠的指定 Ubuntu 系統,我們在讀/寫模式下執行 badblocks,每個驅動器上 4 次通過。為了簡化事情,我們編寫了一個腳本,列印“數據將從您的所有驅動器中刪除”警告,然後在除系統驅動器之外的每個驅動器上執行壞塊。

在開始使用硬碟之前刻錄硬碟有多重要?

如果您有良好的備份和良好的高可用性系統,那麼不會很多。因為從故障中恢復應該很容易。

您如何實施老化過程?你用什麼軟體來刻錄驅動器?對於老化過程來說,多少壓力太大了?

當我得到它時,我通常會針對驅動器或新系統執行壞塊。每當我從備件堆中復活一台電腦時,我都會執行它。像這樣的命令 ( badblocks -c 2048 -sw /dev/sde) 實際上每次都會以不同的模式(0xaa、0x55、0xff、0x00)寫入每個塊 4 次。這個測試對測試大量隨機讀/寫沒有任何作用,但它應該證明每個塊也可以被寫入和讀取。

您還可以執行基準測試工具bonnie++iometer 。這些應該嘗試對您的驅動器施加一些壓力。即使您嘗試將其最大化,驅動器也不應該出現故障。所以你不妨試試看他們能做什麼。不過我不這樣做。當您在未來查看性能問題時,在安裝/設置時獲取儲存系統的 I/O 基準測試可能會非常有用。

你在硬碟中刻錄多長時間?

在我看來,一次執行 badblocks 就足夠了,但我相信我有一個非常強大的備份系統,我的 HA 需求並沒有那麼高。我可以承受一些停機時間來恢復我支持的大多數係統的服務。如果您非常擔心,認為可能需要多通道設置,那麼您可能應該擁有 RAID、良好的備份和良好的 HA 設置。

如果我趕時間,我可能會跳過老化。我的備份和 RAID 應該沒問題。

引用自:https://serverfault.com/questions/309113