Hp

Proliant ML310e Gen8 智能陣列預測 SSD 故障問題

  • January 4, 2021

這是一個與此相關的問題:

ProLiant Gen8 伺服器中的第三方 SSD 解決方案

但未包含在問題或答案中。

我有一個 OCZ 120 gig SSD 作為 Proliant ML310e Gen8 伺服器上的系統驅動器,位於 SATA 埠 6 上。為了將該埠(在主機板上)用於 SSD,我必須將 SATA 控制器設置為 SMART Array 控制器。這為我提供了一組 RAID 硬碟驅動器的所有 4 個托架。

到現在為止還挺好。我還在系統驅動器上安裝了 Win Server 2008 R2,一切正常。

但是 - 當我破解 SMART Array 時,它顯示“預測的驅動器 0 (SSD) 故障”。我已經檢查並驗證了 SSD 的實際 SMART 設置,驅動器 100% OK。它是全新的,並且 SMART 設置已被 OCZ 支持驗證為 100% OK。

我無法在 HP 診斷方面清除此錯誤,並且在 OCZ 的建議下,我一直試圖弄清楚如何關閉 HP 上的 SMART 診斷,但無濟於事。

所以 - 我怎樣才能清除 OCZ SSD SMART 數據的 HP SMART Array(不正確)診斷讀數,或者如何關閉 HP 從 SSD 讀取 SMART 統計數據。

我意識到這完全是我自己的錯,因為我不想在 HP 品牌的 SSD 上花費 1000 美元以上,但 OCZ 執行得非常好。只是 SMART 的 OCZ 版本與 HP 對 SSD 驅動器統計的 SMART 想法不一樣,而且我真的厭倦了黃色閃爍的“系統降級”前面板燈。

是的,我已經被告知“在上面貼上黑色電工膠帶”。:-)

但我真的很想找到一個更好的解決方案。這種 SMART 的東西應該​​是准通用的。

我在內置 b120i 埠 5/6 上執行帶有 SATA SSD 的 ML310e Gen8 v2(無陣列/jbod - 僅使用控制器使埠 6 可啟動),並找到了一種解決方案來阻止 SSD 驅動器在重新啟動時顯示為失敗!這是執行 linux/zfs 的 homelab,但我肯定會在生產中使用。

  1. 打開 Smart Storage Administrator (SSA) - 一旦檢測到控制器,我就使用 F5 在 POST 上執行此操作。您也可以通過 Intelligent Provisioning (F10) 來完成。
  2. 轉到修改控制器設置並禁用“表面掃描分析優先級”。這將阻止控制器嘗試對您的 SSD 進行表面掃描,從而阻止它們被標記為失敗。
  3. 享受第 3 方 SATA SSD,而不會因為啟動失敗而被禁用。

HP Smart Storage 管理員使用者指南提供了解決方案的提示。似乎表面掃描模式會導致 SSD 被標記為失敗的問題。本手冊顯示了訪問 SSA 的其他方法 - 如果您真的想在其他驅動器上使用它(但是我沒有嘗試過),我相信可以使用 ssacli 工具(也可以通過串列/iLo?)關閉每個插槽的表面掃描模式因為我不使用任何陣列控制器功能……改為使用智能監控)

根據 SSA 使用者指南,此設置也適用於 Gen9。還有 Gen6、Gen7(通過下載圖像訪問 SSA)——我懷疑 Gen5 也可以工作,因為它支持 ssacli。

引用自:https://serverfault.com/questions/562086