Linux

使用 nagios 監控 HP Smartarray (cciss)

  • January 12, 2015

我正在嘗試使用 nagios 監控 HP Smart Array 控制器。我在 2 個 RAID1 陣列上有 4 個磁碟,所以每個 RAID1 有 2 個磁碟。

我安裝了 nrpe-server 和 nrpe-plugins 並且我正在使用全能check_raid外掛,但它似乎只看到我的第一個數組而不是第二個:

# /usr/lib/nagios/plugins/check_raid
OK: cciss:[/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK, /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK]

cciss_vol_status正確報告兩個數組:

# cciss_vol_status /dev/cciss/c0d0
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK. 
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK. 
# cciss_vol_status /dev/cciss/c0d1
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 0 status: OK. 
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 1 status: OK. 

如何check_raid報告兩個陣列?

該伺服器是帶有 Smart Array E200i 控制器的 HP Proliant DL360 G5。它目前正在執行 debian wheezy。

我的建議是為伺服器使用HP Management and Health Agents。這些可以通過電子郵件發送、轉儲到系統日誌並發送 SNMP 陷阱。

如果您絕對必須在 Nagios 中報告此內容,那麼似乎有很多選擇。但是 HP 工具集的一個組件是hpssacliorhpacucli實用程序,它的輸出可以被解析:

# hpssacli ctrl all show config

Smart Array P420i in Slot 0 (Embedded)    (sn: 001438025AC2EA0)

  Internal Drive Cage at Port 1I, Box 2, OK

  Internal Drive Cage at Port 2I, Box 0, OK
  array A (SAS, Unused Space: 340650  MB)

     logicaldrive 1 (72.0 GB, RAID 1, OK)
     logicaldrive 2 (600.0 GB, RAID 1, OK)

     physicaldrive 1I:2:1 (port 1I:box 2:bay 1, SAS, 900.1 GB, OK)
     physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SAS, 900.1 GB, OK)

  SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380  (WWID: 5001438025AC2EAF)

或者

# hpssacli ctrl slot=0 ld 1 show status

  logicaldrive 1 (72.0 GB, 1): OK

# hpssacli ctrl slot=0 ld 2 show status

  logicaldrive 2 (600.0 GB, 1): OK

或許:

# hpssacli ctrl all show config | grep logicaldrive
     logicaldrive 1 (72.0 GB, RAID 1, OK)
     logicaldrive 2 (600.0 GB, RAID 1, OK)

引用自:https://serverfault.com/questions/658936