Raid

更換 HP ProLiant DL380p Gen8 伺服器上 RAID 5 陣列中的硬碟驅動器

  • June 25, 2019

我是我組織中相對較新的(也是唯一的)系統管理員。我們有一台 HP ProLiant DL380p Gen8伺服器,它不再受 HP 的任何形式的支持契約。我們將它用作 4 個虛擬伺服器的 Hyper-V 主機。虛擬主機本身不會被備份,但在其上執行的虛擬伺服器會備份到 Azure。(我們只需要物理伺服器再持續幾個月,直到我將最後剩下的應用伺服器移動到雲中,並將我們所有的使用者/機器從本地 AD 切換到 Azure AD)。伺服器的 RAID 控制器是Smart Array P420i 控制器

昨天,伺服器的 RAID 5 陣列中的一個 300 GB 驅動器(陣列中總共有三個驅動器)開始交替閃爍綠色和琥珀色。根據手冊第 102 頁和伺服器的 iLO 界面,該驅動器處於“降級(預測故障)”狀態。

實際上是我第一次在生產伺服器上更換 RAID 驅動器,我想確保我不會把它搞砸。作為唯一的管理員,我沒有可以尋求幫助的人。

  1. 我是否必須等待驅動器實際發生故障才能將其換出?還是我現在可以先發製人地把它換掉?
  2. 驅動器是否可以簡單地熱插拔(如按下彈出按鈕,將其拉出,然後彈出新驅動器)?RAID 陣列會開始自動重建,還是我需要告訴控制器/Windows 新驅動器的存在?
  3. 冷交換驅動器有什麼風險/好處嗎?伺服器技術上不需要在下班時間熬夜,所以我可以留下來冷交換它。但是,這個答案說冷交換存在危險,並且“必須在系統執行時完成”……這是一個較舊的伺服器模型,但我不明白為什麼冷交換會出現問題。
  4. 我讀過有關嘗試重建 RAID 5 陣列時出現其他驅動器故障的資訊。由於該驅動器在技術上並未發生故障,而只是“預計會發生故障”,因此這是否以任何方式減少了另一個驅動器發生故障的可能性(因為如果它們很快發生故障,它們將處於與此相同的狀態一個,並且不處於健康狀態)?這更多是為了我自己的安心哈哈…

感謝你的幫助!

  1. 不,你最好盡快更換它。由於其他驅動器可能會發生故障,因此儘早採取行動是最好的做法。
  2. 是的,它可以熱插拔。在主機本身上,因為它是 Windows 上的 Hyper-V,如果您安裝了 raid 實用程序,您可以看到 RAID 的狀態。您可以從那裡發出重建以防止重新啟動。
  3. 不,但我會在伺服器執行時這樣做。
  4. 是的,因為當插入新驅動器時,重建會對剩餘驅動器造成額外壓力,因此最好儘早進行。這個想法是,如果一個驅動器出現故障,其他驅動器可能會過早出現故障。為了說明這一點,就像汽車輪胎一樣,它們具有相同的螺紋磨損,因此在邏輯上可能會像已經感覺到的那樣很快失效。

引用自:https://serverfault.com/questions/972853