Raid

P812“忘記”RAID6 - 在 ORCA 中啟動時看不到磁碟

  • June 7, 2013

我們有一個帶有 12x4TB 非 HP 問題 Seagate Constellation ES.3 驅動器的 MSA60,連接到 P812/FBWC,我在其上使用 hpacucli 在所有這些磁碟上創建了一個 RAID6,並開始在它們上複製數據。

此外,我在復製過程的早期階段拉出了一個驅動器並更換了它,只是為了看看 RAID6 重建會對我們的生產場景的寫入(以及後來的讀取)性能造成多麼嚴重的影響。(還不錯,重建需要大約 5 天時間)。該驅動器進行了 75% 的重建。

現在我用 Debian Squeeze 重新啟動了 DL385G7,P812 連接到它上面,並且在重新啟動時,P812 上不再有陣列。內部 P410i 陣列完好無損。Hpacucli 確實看到了驅動器,但將它們列為未分配。我用Google搜尋了一下,得到的建議是重新創建相同的數組會將它帶回來。我確實這樣做了。vgscan 沒有找到 LVM 卷。

我重新啟動並進入 ORCA。ORCA 說沒有捲,也沒有驅動器。

現在我有點吃驚 - 可能是什麼問題?ORCA 看不到驅動器,但 hpacucli 可以?這可能是為什麼我用 hpacucli 創建並且已經使用的 LD 沒有彈出的問題嗎?

我有一個替換 minisas 電纜和一個替換 MSA60,我可以隨意使用。更換 P812 需要一段時間。

我該如何調試?如果不使用外部取證公司,我有什麼機會取回數據?

編輯:好的,現在 hpacucli 也看不到驅動器了。我想我會先更換 MSA60 外殼。

編輯2:好吧,忽略所有“如果你有錢支付HP-disk-tax,你只是一個專業人士”勢利,以下已經發生了:

  • 我沒有檢查實際存在的 MSA:
=> ctrl slot=1 enclosure all show
Error: The specified device does not have any storage enclosures.

本可以告訴我我需要的一切。

  • 交換 P812 上的電纜和埠後,我交換了 MSA60(冷),你瞧,我的陣列出現了。
  • 以前在 70% 左右的重建磁碟現在標記為“OK”,提示我執行文件系統檢查。我懷疑控制器將在初始重新掃描後繼續重建。

請不要說我沒有“只是為了好玩”拉磁碟。我拉它是為了判斷 RAID6 是否足以滿足我們的生產需求。我鼓勵每個人都為新配置做這件事——不管是在儲存、軟體還是網路設備中。

你的數組可能已經消失了。我懷疑您可能遇到了韌體問題。很有可能您的 P812 控制器沒有處於良好的修訂級別。此外,MSA60 於 2008-2009 年報廢。

  • 您在配置此陣列之前是否執行了任何更新?
  • Smart Array P812 控制器正在執行什麼版本的韌體?
  • MSA60 是否處於良好水平?
  • 這些是 SAS 還是 SATA 驅動器?
  • 驅動器協商的連結速度是多少?1.5Gbps?3Gbps?
  • 您可以引導陣列配置實用程序並執行 HP ADU 診斷報告嗎?
  • 最後,拉上一切的電源。讓驅動器和機箱減速。再試一次。

MSA60 和 Smart Array 控制器上的故障非常罕見。我想你遇到了一個錯誤。使用 RAID6(在大多數情況下不是最佳的)和不受支持的磁碟可能是一個問題。尤其是 SATA。如果有的話,我會執行它們 RAID 1+0 以減少出現控制器問題的機會。

最近韌體修復的潛在問題(過去一年)…

  • 添加了保護以防止在熱添加硬碟驅動器時在極少數情況下潛在的 Smart Array 控制器掛起。
  • 在極少數情況下,當 PHY 卡住超過四秒時,Smart Array 控制器會多次重置同一個 SATA 驅動器。
  • Smart Array 控制器在重壓下無法在 20 毫秒內連接到硬碟驅動器。
  • 修復了 HP P812 控制器在重啟時可能發生罕見鎖定(程式碼 0xD4)的問題。
  • 修復了將 SATA 磁碟熱添加到 MSA-60、MSA-70 或 HP DL180-G6 12 驅動器背板後,儲存控制器可能變得無響應的問題。參考客戶諮詢 c03011608。
  • 修復了同時處理支持本機命令隊列的 SATA 磁碟上的許多不可恢復的讀取錯誤可能導致鎖定(程式碼 0x15)的問題。
  • RAID 6/60 表面分析可能導致後台奇偶校驗掃描停止響應,同時進行過多的容錯計算。
  • 在繁重的 I/O 工作負載期間,連接到多個 MSA 60 儲存系統的 Smart Array P812 控制器可能會遇到鎖定情況(鎖定程式碼 0XAB)。
  • 熱更換 HP Smart Array HDD 後,連接到更換 HDD 的擴展器的所有驅動器報告為位於托架 0。HP StorageWorks MSA60、HP StorageWorks MSA70 和 HP ProLiant DL180 G6 上出現問題帶有 12 托架和 25 托架背板。

引用自:https://serverfault.com/questions/514100