Linux
使用 nagios 監控 HP Smartarray (cciss)
我正在嘗試使用 nagios 監控 HP Smart Array 控制器。我在 2 個 RAID1 陣列上有 4 個磁碟,所以每個 RAID1 有 2 個磁碟。
我安裝了 nrpe-server 和 nrpe-plugins 並且我正在使用全能
check_raid
外掛,但它似乎只看到我的第一個數組而不是第二個:# /usr/lib/nagios/plugins/check_raid OK: cciss:[/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK, /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK]
cciss_vol_status
正確報告兩個數組:# cciss_vol_status /dev/cciss/c0d0 /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK. /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK. # cciss_vol_status /dev/cciss/c0d1 /dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 0 status: OK. /dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 1 status: OK.
如何
check_raid
報告兩個陣列?該伺服器是帶有 Smart Array E200i 控制器的 HP Proliant DL360 G5。它目前正在執行 debian wheezy。
我的建議是為伺服器使用HP Management and Health Agents。這些可以通過電子郵件發送、轉儲到系統日誌並發送 SNMP 陷阱。
如果您絕對必須在 Nagios 中報告此內容,那麼似乎有很多選擇。但是 HP 工具集的一個組件是
hpssacli
orhpacucli
實用程序,它的輸出可以被解析:# hpssacli ctrl all show config Smart Array P420i in Slot 0 (Embedded) (sn: 001438025AC2EA0) Internal Drive Cage at Port 1I, Box 2, OK Internal Drive Cage at Port 2I, Box 0, OK array A (SAS, Unused Space: 340650 MB) logicaldrive 1 (72.0 GB, RAID 1, OK) logicaldrive 2 (600.0 GB, RAID 1, OK) physicaldrive 1I:2:1 (port 1I:box 2:bay 1, SAS, 900.1 GB, OK) physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SAS, 900.1 GB, OK) SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380 (WWID: 5001438025AC2EAF)
或者
# hpssacli ctrl slot=0 ld 1 show status logicaldrive 1 (72.0 GB, 1): OK # hpssacli ctrl slot=0 ld 2 show status logicaldrive 2 (600.0 GB, 1): OK
或許:
# hpssacli ctrl all show config | grep logicaldrive logicaldrive 1 (72.0 GB, RAID 1, OK) logicaldrive 2 (600.0 GB, RAID 1, OK)