Unix

用於管理任意 *nix 守護程序及其活動的“必備”工具

  • January 30, 2010

您建議使用哪些工具來管理正在執行的守護程序?這包括:

  1. 負載監控:當一個守護程序減慢整個伺服器時,它會重新啟動
  2. 保持活力:當它不起作用時重新啟動它。也許,連接檢查?
  3. 任何高級日誌處理/輪換/解析工具?
  4. 方便的錯誤通知:電子郵件、icq、jabber、…
  5. 實時監控:munin || nagios,當然!:) 也許還有其他好東西可以使用?
  6. …其他建議?

負載監控:當它減慢整個伺服器時,重新啟動一個守護程序保持活動:當它不起作用時重新啟動它。也許,連接檢查?

Nagios 可以使用事件處理程序完成這兩項任務,不過對於 renice,我可能寧願讓它自己執行,因為如果伺服器負載不足,通過 ssh 之類的檢查可能會超時。理想情況下,守護程序有自己的控制項來防止這種情況發生,即“最大連接數”。

Any advanced log processing/rotation/parsing tools?

我喜歡 logrotate 進行日誌輪換,這是非常標準的。對於處理,如果您負擔得起,或者不需要付費版本提供的功能,我喜歡 Splunk。

Handy error notifications: e-mail, icq, jabber, ... 

要添加到您的列表中,很多人喜歡文本 (SMS) 消息。

引用自:https://serverfault.com/questions/91138