Hardware

如何從 RAID 5 配置中的驅動器故障中恢復?

  • June 13, 2019

今天早上,我們的數據庫伺服器上的一個驅動器出現故障。驅動器陣列(3 個磁碟)設置為 RAID 5 配置。

在等待更換驅動器時,我們正在準備恢復策略。使用者繼續在系統上工作,儘管速度很慢(不知道為什麼??)。

如何安裝新驅動器 - 該驅動器的數據會自動從奇偶校驗中重建,還是我們應該遵循另一個過程?

編輯: 這是一個硬體 RAID 控制器。(感謝到目前為止的答案,不勝感激)

系統執行非常緩慢,因為它必須重建失去的數據,這涉及額外的 CPU 和 I/O。

如果您在 RAID-5 配置中缺少磁碟,則您沒有恢復策略。如果另一個磁碟出現故障,您將失去數據。跑到最近的供應商那裡,不要步行,從那裡您可以獲得製造商保修範圍內的兼容元件,該元件由當日緊急快遞員運送。如果您購買陣列的供應商已經在獲取該元件,請獲取這兩個元件並將另一個作為備用元件存放起來。

如果您將 RAID-5 用於生產系統,您應該考慮在陣列中保留一個備用磁碟作為熱備用。

添加 - 如果您的日誌不在單獨的捲(物理上單獨的磁碟)上,請將它們移動到單獨的一組磁碟,甚至只是一個鏡像對。如果您的數據庫有任何顯著負載,這也將是性能上的勝利,因為日誌卷的爭用會對性能產生不成比例的不良影響。

如果可能的話,您還可以通過執行以下操作使您的數據庫更加健壯:

  1. 關閉數據庫。
  2. 備份數據庫。
  3. 將日誌移動到物理上獨立的一組磁碟(確保重新配置數據庫,以便它知道日誌已移動到哪裡)。
  4. 重新啟動數據庫和應用程序。

如果您將日誌放在單獨的捲上,當且僅當磁碟故障不會危及日誌時,您可以從備份中恢復和前滾。出於以下原因(除其他外),數據庫日誌應位於單獨的磁碟捲上:

  • 日誌使用模式主要是順序的,將日誌條目附加到文件的末尾(文件實際上是一個環形緩衝區)。這意味著可以快速寫出大量日誌條目,因為磁碟磁頭尋軌活動很少。
  • 如果它們與大量隨機訪問工作負載(例如事務表和索引)共享物理磁碟,則它們將不成比例地減慢,因為磁頭尋軌活動會中斷順序寫入。
  • 將日誌放在單獨的捲上幾乎總是可以提高性能,並且只需要一個鏡像對來支持相當繁重的工作負載。這意味著執行此操作的硬體非常便宜,因此只需很小的成本就可以獲得很大的性能和可靠性。
  • 如果您的數據陣列出現故障,日誌不會失去。如果您有適當的備份策略,您可以從備份中恢復並從日誌中前滾。這意味著整個陣列可以在伺服器上關閉而不會出現單點故障。日誌和數據陣列必須同時發生故障才能導致數據失去。

引用自:https://serverfault.com/questions/116888