Ubuntu
Ubuntu:監控硬體 RAID 並在失敗時通知?
我在一些新的 Ubuntu 10.04 x64 伺服器中使用3ware 9650SE-2LP Raid 控制器進行 2 驅動器 RAID 1 設置。
當其中一個驅動器發生故障時,伺服器是否有辦法向我發送通知?如果可能的話,我更喜歡電子郵件通知。謝謝。
3ware 提供3dm2 監控/管理程序。看看他們的網頁,有一個適用於 linux 的二進製版本,它甚至可以正常工作
$$ under debian at least $$. 事情是 - 我從不相信那些花哨的工具……所以我這樣做了。所以我使用自己的基於 tw_cli 的腳本——也可以從 3ware 網站下載。
我每週進行一次巡邏,閱讀:
./tw_cli /c0/u0 start verify
並且一直以來,每 15 分鐘我都會轉儲目前的突襲狀態:
./tw_cli /c0 show > current.txt
我使用非常簡單的 nagios 外掛來檢查目前狀態是否與預期相同
$$ i just compare content of a file to well known status dump that was taken at the beginning $$.
#!/bin/bash if [ `diff current.txt expected.txt|wc -l` -ne 0 ] ; then echo "CRITICAL - current state of raid does not match expected pattern " exit 2 fi if [ `find . -name current.txt -mmin -16|wc -l` -ne 1 ] ; then echo "CRITICAL - state file is old " exit 2 fi echo "OK" exit 0
您可能會使用郵件而不是出口 2… 或者更可能使用 3dm2。