Nagios

驗證 cronjob 是否在失敗時使用 Nagios 通知執行的最佳方法?

  • September 23, 2009

我有一個每天早上執行的 cron 作業,成功執行時會生成一個輸出文件。我希望有一個後續流程來驗證作業是否正確執行,或者如果沒有,則觸發 Nagios 警報。

我覺得我可以使用 Nagios check_file_age 服務檢查來完成這項工作,該檢查通過仔細建構服務 def 中的 check_interval 和 check_period 來限制檢查每天早上只發生一次,但我想知道是否有更簡單的方法?

有幾個選項浮現在腦海中:

  1. 使用被動檢查結果讓驗證腳本告訴 Nagios 發出警報,如果您想知道驗證腳本是否沒有執行,請設置 24 小時多一點的新鮮時間間隔,並有一個始終執行的主動檢查命令危急; 要麼
  2. 讓 cron 作業本身在成功完成時送出 OK 被動檢查結果,但在失敗時不執行任何操作。然後,再次使用自動關鍵的主動檢查命令進行新鮮度檢查,以便在一切不順利時發出警報。

引用自:https://serverfault.com/questions/67881