X345 和 ServeRaid 5i - 已失效的驅動器
我有一個帶有 ServeRaid 5i 卡的舊 IBM X345 伺服器,我作為文件伺服器/測試伺服器執行。
它執行的是 VMWare ESXi 3.5,其中有一個虛擬化的 OpenSolaris 機器(以及其他機器),ZFS 作為文件系統。
無論如何,最近,在重新啟動後,在啟動時,ServerRaid 抱怨兩個邏輯陣列處於離線狀態。我的機器中有六個 SCSI 驅動器 - 四個 147 Gb 驅動器和兩個 72 Gb 驅動器。從記憶體中,前四個驅動器在一個陣列/邏輯磁碟中,第五個驅動器在它自己的一個中。未使用第六個驅動器。
是的,這是在 RAID 0 中執行的……我知道,真丟臉。
我啟動了 ServeRaid Support CD,第一個和第五個驅動器被標記為已失效。
第一個驅動器 (147 Gb) 列為失效驅動器,I/O 子系統錯誤,第五個驅動器 (72 Gb) 列為失效驅動器,未找到物理驅動器。當我右鍵點擊時,我確實看到了將驅動器再次標記為線上的選項(我不確定這將如何處理未找到的物理驅動器?),但是,如果我繼續,則會出現有關數據失去的警告. 我假設這不是我想要恢復磁碟的選項。
IO/子系統錯誤到底是什麼意思?如果我線上標記它會炸掉磁碟嗎?
此外,在伺服器上的 Lightpath 控制台上,DASD 上有一個橙色的錯誤指示燈。我猜這不是一個好兆頭?或者是嗎?可能只是ServeRaid卡嗎?因為如果是這樣,我可以替換它..嘆息,真的希望它是。
無論如何,我應該如何繼續前進?有什麼方法可以將失效的驅動器(io 子系統或未找到的物理驅動器)恢復到初始狀態?或者我可以以某種方式從剩餘的驅動器中重建數據嗎?(我想在那之後我會有一個損壞的 VMFS(VMWare 文件系統),然後我必須重建它,然後重建其中的虛擬磁碟映像……?)
關於如何進行的任何建議?(是的,有些人可能會說……哦……只是重新格式化,下次使用 RAID1……哈哈。希望有比這更有希望的東西……哈哈)。
謝謝,維克多
Ps:我還在這裡提供了 ServeRaid 的支持存檔:
http://www.victorhooi.com/files/Support.zip
(這基本上是所有控制器日誌和配置資訊)。
橙色指示燈並不意味著驅動器損壞:它意味著它被標記為失敗。
最近我在 ServeRaid 6i 上遇到了同樣的問題:兩個驅動器消失了。突襲是 5 級。我將其中一個放到了線上,然後我重建了第二個。在這個過程結束時,我得到了我的陣列重建。當然,這不是一個損壞的磁碟,而是控制器或磁碟中的一個奇怪的錯誤。
一些磁碟似乎有損壞的韌體,導致磁碟隨機從陣列中分離。