Raid

Proliant RAID 1 重建問題

  • April 3, 2015

我有一台 HP Proliant ML350 G5 伺服器在一夜之間出現電源故障。更換了電源,但不幸的是,它只插入了 RAID 1 集中的 1 個磁碟重新啟動。(raid 控制器是 E200i 中的建構)。

然後,RAID BIOS 在啟動時說它已進入臨時恢復模式。但是,我原以為它仍會僅使用 1 個驅動器啟動。然而,bios 說它找不到 C: 驅動器並進入輪詢其他引導設備的重啟循環。第一個問題是,這種正常行為不是在 1 個磁碟上啟動嗎?

然後插入第二個驅動器(所有驅動器都正常),raid bios 開始在該磁碟上自動重建。這似乎是一個後台程序,因為沒有顯示任何進展。然而,根據閃爍的燈光,它看起來正在工作。我的第二個問題是重建需要多長時間?(36GB 15K SAS 驅動器)。

我看不到任何錯誤消息,看起來它正在重建驅動器,但電腦仍然無法啟動。在啟動過程中它仍然說找不到 C: 驅動器。如果我等待重建完成,它可能會自行修復並找到 C: 驅動器嗎?還是這裡有其他問題?

答案

這是我解決這個問題後得出的結論。

1)不,這不正常。在我們的系統上(與大多數其他系統一樣),如果其中一個 RAID 1 磁碟失去或正在重建過程中,則剩餘的單個磁碟應該仍然可以正常執行並正確啟動。(儘管控制器確實會進入降低性能模式。)

  1. 我們系統上的 RAID 1 重建需要大約 4.5 小時來重建磁碟,然後再將它重新放入。對於我來說,對於未使用的 RAID 1+0 36GB 15k rpm SAS 驅動器來說,這似乎需要很長時間時間。但這就是它所需要的。(作為實驗,我從這台機器的配套 RAID 5 陣列中取出並更換了一個 10k rpm 146GB SAS 驅動器,它使用 4 個磁碟。用了不到 2 個小時。去看看。)

  2. 我在這台機器上遇到的根本問題是機器的 NVRAM 損壞。我只能假設電源故障是造成它損壞的原因。雖然 BIOS 中沒有明顯的跡象表明有任何問題。所有設置看起來都應該是這樣。但是,通過主機板上的 S6 開關清除 NVRAM 後,系統啟動沒有問題。我猜引用的引導控制器在某些基礎 BIOS 設置中發生了某種變化。(順便說一句,如果您這樣做,請不要忘記重置日期和時間,然後讓您的伺服器因接收郵件和失去備份而忘乎所以。)

你有一些時髦的東西在那裡,雖然我不完全確定它是什麼。

伺服器應該引導並正常執行,其中只有 1 個驅動器。應該發生的只是控制器陣列標記為降級,但作業系統不關心(甚至不知道)這種情況,應該照常進行。

關於重建,我通常會說查看 HP Array Diag Utility,因為它可以為您提供一些重建進度的指示。由於此時作業系統聽起來很糟糕,BIOS可能有一些基本的配置陣列和顯示它們的狀態。否則,您應該能夠從包含 HP Array Diag Utility 的 StartSmart CD 啟動。一個 36GB 驅動器的重建速度應該相對較快 - 我在一個早上看到 ML370 上的 36GB RAID1 重建。

確定是 BIOS 告訴您驅動器C:未找到嗎?C:是一個非常 Windows 的東西,我很驚訝 BIOS 會引用一個非常以 Windows 為中心的東西,就像可以安裝其他作業系統時那樣(它可能很好,只是讓我覺得很奇怪)。

引用自:https://serverfault.com/questions/247406