Nagios
驗證 cronjob 是否在失敗時使用 Nagios 通知執行的最佳方法?
我有一個每天早上執行的 cron 作業,成功執行時會生成一個輸出文件。我希望有一個後續流程來驗證作業是否正確執行,或者如果沒有,則觸發 Nagios 警報。
我覺得我可以使用 Nagios check_file_age 服務檢查來完成這項工作,該檢查通過仔細建構服務 def 中的 check_interval 和 check_period 來限制檢查每天早上只發生一次,但我想知道是否有更簡單的方法?
有幾個選項浮現在腦海中:
- 使用被動檢查結果讓驗證腳本告訴 Nagios 發出警報,如果您想知道驗證腳本是否沒有執行,請設置 24 小時多一點的新鮮時間間隔,並有一個始終執行的主動檢查命令危急; 要麼
- 讓 cron 作業本身在成功完成時送出 OK 被動檢查結果,但在失敗時不執行任何操作。然後,再次使用自動關鍵的主動檢查命令進行新鮮度檢查,以便在一切不順利時發出警報。