多個 RAID 控制器的 Windows Server 崩潰
我在 Proliant DL580 G7 上有 4 個控制器:P410i、LSI9261、P812、P410.添加最後兩個或一個作業系統(Windows Server)後開始崩潰。消除最後兩個有幫助(在 RBSU 中禁用它們)。但我需要它們:我有 6 個機箱(每個機箱有 4 個 HDD)和機箱 D2700(20 個 HDD)。P812 通過外部埠只能看到 D2700 - 因此我無法將機箱連接到 P812 並使用其他控制器。每個都通過內部控制器埠處理 2X4 HDD。所有控制器共享相同的 IRQ - 10,並且嘗試更改一個控制器的 IRQ 會自動將其他控制器更改為新的 IRQ(在 RBSU 中)。P812 和 P410 具有 ROM v 6.62,P410i 具有 v 6.40。怎麼修?即使大多數磁碟與控制器斷開連接,伺服器也會崩潰 - 4 個控制器的存在足以導致崩潰。(我應用了 G7 最新 SPP 推薦的更新)
我用過 lsi 控制器,
首先:
任何品牌的控制器通常都會嘗試相互連接並相互查看各種配置。而且當他們的 rom 軟體版本發生變化時,他們大多無法恢復陣列或卷。
第二:
由於同年的卡使用相同的LSI晶片,因此可以將其他品牌和不同版本的bios強製到不同的卡上。我猜這被稱為交叉閃爍。從品牌到品牌,從 IR 模式到 IT 模式(SATA forward 僅禁用 ram 和 raid on card)。
我要做的很簡單。如果您無法從事件查看器中找出崩潰的原因,請執行以下操作,如果一個要點未能解決問題,請切換到下一個
- 檢查電源是否足夠
- 切換並檢查 pci-e 埠(可能裡面有一些金屬廢料或紙張)
- 目視檢查卡片是否有燒傷痕跡或損壞的 smd
- 匹配 rom 軟體版本並找出有問題的版本
- 交叉快閃記憶體有問題的一個以匹配所有品牌並放置相同的 rom 軟體版本。
- cross flash all into IT mode 用 mdadm 軟體 raid 做你的 raid 事情。
通常在這些情況下,我們會購買一些新卡。但是sata - 軟體raid 的方法是很紮實的。我在每個設置中都使用它。您只需要正確使用一些 bash mdadm 命令。與 LSI 手冊相比,它的幾個命令非常簡單,數千個 raid 控制器命令,巡邏讀取,一致性檢查計劃等。
我最喜歡的設置是來自多個 ssd 的帶有 bcache 的軟體 raid 10 mdadm。它適用於 iscsi 和 samba。您只需要正確調整 raid 塊和 fs 集群大小。
小心不要失去數據。這是我使用的方法,但我對您的設備或數據失去或任何其他類型的損壞不承擔任何責任。這些交叉閃爍的東西和突襲設置是有風險的(永遠如此)。