Raid

使用 P812 控制器在 HP D2700 機箱中讀取 SATA 驅動器上的 SMART 屬性的 Windows 工具

  • August 29, 2017

我有兩台 HP DL380 G7 伺服器 + P812 控制器 + D2700 機箱。它們是具有 144 Gb RAM 的數據庫伺服器。P812 韌體為 6.40,D2700 為 0147

它們都與 18 OWC Mercury Extreme SSD (SATA) 配合得很好。在我在兩個 D2700 機箱中再添加 6 個 SSD 以在每個機箱中製作 24 個 SSD 之後,其中一個伺服器的磁碟性能與升級前的狀態和另一台伺服器相比非常差。

所以我懷疑添加到性能較差的伺服器的 6 個 SSD 中的一個有故障。但是哪一個?HP Arrays Configuration Utility 未顯示任何問題,POST 時也未出現任何問題。即使是長的 ACU 報告也沒有顯示任何內容。

所以我想看看這些驅動器的 SMART 屬性,看看我是否能找出失敗的那個。是否有 Windows 工具可以讓我查看此配置中的 SMART 屬性?

在一個非常相似的問題中,HP Proliant 伺服器中的第 3 方 SSD 驅動器 - 監控驅動器執行狀況建議使用 smartmontools 中的 smartctl。不幸的是,我沒有看到 P812+D2700 背後的 SSD - 我怎樣才能讓 smartctl 工作?

C:\Program Files\smartmontools\bin>smartctl -a /dev/sdc,0 -T permissive -s on
smartctl 6.3 2014-06-23 r3922 [x86_64-w64-mingw32-2012r2] (cf-20140623)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor:               HP
Product:              LOGICAL VOLUME
Revision:             6.40
User Capacity:        5,760,841,244,672 bytes [5.76 TB]
Logical block size:   512 bytes
Rotation Rate:        15000 rpm
Logical Unit id:      0x600508b1001cf0ebb14e9131d7XXXXXX
Serial number:        PAGXQ0ARXXXXXX
Device type:          disk
Local Time is:        Fri Dec 12 18:42:32 2014 EST
SMART support is:     Unavailable - device lacks SMART capability.

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
unable to fetch IEC (SMART) mode page [Input/output error]

=== START OF READ SMART DATA SECTION ===

Error Counter logging not supported

Device does not support Self Test logging

這是非常相似的問題所建議的命令的輸出(我將 /dev/sda 更改為 /dev/sdc,因為這是 P812 上第一個卷的設備:

C:\Program Files\smartmontools\bin>smartctl -a -l ssd /dev/sdc -d sat+cciss,1
smartctl 6.3 2014-06-23 r3922 [x86_64-w64-mingw32-2012r2] (cf-20140623)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

/dev/sdc: Type 'sat+...': Unknown device type 'cciss,1'
=======> VALID ARGUMENTS ARE: ata, scsi, sat[,auto][,N][+TYPE], usbcypress[,X], usbjmicron[,p][,x][,N], usbsunplus, areca,N[/E], auto, test <=======

使用 smartctl -h 獲取使用摘要

這是原始問題的答案,要求使用Windows工具查看 D2700 機箱上 HP SmartArray P812 後面的 SSD 上的 SMART 參數:

截至 2017 年 8 月 29 日,我已經編輯了答案。最初我得出的結論是,沒有基於 Windows 的工具允許我使用 P812 控制器查詢 D2700 機箱中 SATA 驅動器上的 SMART 參數,我看到這是不完全準確。雖然 HP 陣列配置實用程序 (ACU) 不允許我查詢SMART 參數,但它確實會在預測驅動器即將發生故障時通知我,並且此通知也會出現在陣列診斷報告中。

截至最初回答時,我考慮了這三位候選人,但當時他們都沒有完成這項工作。下面的評論可能不再準確:

  • SmartmonTools/smartctl - 根據HP Proliant 伺服器中的第 3 方 SSD 驅動器, Linux 上似乎支持在 HP 控制器後面查詢 SMART - 監控驅動器執行狀況,但 smartctl 的 Windows 版本似乎不支持 HP SmartArray 所需的 cciss 驅動程序控制器根據這個
  • HP SSA CLI - 廣泛支持 HP 控制器,但不支持 SMART - HP 似乎更喜歡他們自己的 SmartSSD Wear Gauge 技術。我使用的命令是:“controller slot=1 ssdphysicaldrive all show detail” 另一個有用的命令是“controller slot=1 show ssdinfo”
  • HD Sentinel -在此處宣傳對 HP 控制器的支持,但是當您閱讀此處的細則時 ,它說它無法在 HP SmartArray 控制器後面進行對等

請提供詳細說明您的預期和實際績效數據的數字。

另外,什麼是 SAS 拓撲?主機和 D2700 JBOD 之間有多少條 SFF-8088 電纜?

正如我之前提到的,HP StorageWorks D2700具有 SMART 意識,並報告SCSI 機箱服務(SES) 詳細資訊……但您的案例範圍很窄。擴展器上有很多 SATA 驅動器。我們知道 SATA 超時會導致共享擴展器背板(例如 D2700 中的背板)出現性能問題。然而,這更有可能是一個旋轉的媒體問題。SSD 不是問題。

根據我的經驗,SSD 要麼工作要麼不工作。中間沒有太多(除非你達到了寫入耐力限制)。所以我要看的是:

  • 由於空間不足,您擴展了陣列。在擴展之前,您的空間究竟有*多少?*我希望你沒有用盡空間。想想 SSD 和該控制器上缺乏 TRIM 支持。
  • 我會建議對這些驅動器進行配置不足或限制邏輯驅動器大小以解決缺少的 TRIM 功能。
  • 更新您的韌體。您正在使用不受支持的 D2700 機箱韌體版本(已召回),並且您的 RAID 控制器也落後了。在撰寫本文時,0149 是正確的 D2700 韌體,您的控制器應該是6.60 版本。也升級主機。
  • 也許是時候加強你的遊戲了。超額訂購匯流排(RAID 控制器和 JBOD 背板)上的 24 個消費級 SATA SSD,其中 6Gbps SATA 驅動器降檔至 3Gbps,這意味著您也達到了硬體的上限。Smart Array P812 控制器在大約 6 個磁碟時的 SSD IOPS回報遞減。

引用自:https://serverfault.com/questions/652271