Ubuntu

Ubuntu:監控硬體 RAID 並在失敗時通知?

  • May 6, 2010

我在一些新的 Ubuntu 10.04 x64 伺服器中使用3ware 9650SE-2LP Raid 控制器進行 2 驅動器 RAID 1 設置。

當其中一個驅動器發生故障時,伺服器是否有辦法向我發送通知?如果可能的話,我更喜歡電子郵件通知。謝謝。

3ware 提供3dm2 監控/管理程序。看看他們的網頁,有一個適用於 linux 的二進製版本,它甚至可以正常工作

$$ under debian at least $$. 事情是 - 我從不相信那些花哨的工具……所以我這樣做了。所以我使用自己的基於 tw_cli 的腳本——也可以從 3ware 網站下載。

我每週進行一次巡邏,閱讀:

./tw_cli /c0/u0 start verify

並且一直以來,每 15 分鐘我都會轉儲目前的突襲狀態:

./tw_cli /c0 show > current.txt

我使用非常簡單的 nagios 外掛來檢查目前狀態是否與預期相同

$$ i just compare content of a file to well known status dump that was taken at the beginning $$.

#!/bin/bash

if [ `diff current.txt expected.txt|wc -l` -ne 0 ] ; then
       echo "CRITICAL - current state of raid does not match expected pattern "
       exit 2
fi

if [ `find . -name current.txt -mmin -16|wc -l` -ne 1 ] ; then
       echo "CRITICAL - state file is old "
       exit 2
fi
echo "OK"
exit 0

您可能會使用郵件而不是出口 2… 或者更可能使用 3dm2。

引用自:https://serverfault.com/questions/139069