Unix
用於管理任意 *nix 守護程序及其活動的“必備”工具
您建議使用哪些工具來管理正在執行的守護程序?這包括:
- 負載監控:當一個守護程序減慢整個伺服器時,它會重新啟動
- 保持活力:當它不起作用時重新啟動它。也許,連接檢查?
- 任何高級日誌處理/輪換/解析工具?
- 方便的錯誤通知:電子郵件、icq、jabber、…
- 實時監控:munin || nagios,當然!:) 也許還有其他好東西可以使用?
- …其他建議?
負載監控:當它減慢整個伺服器時,重新啟動一個守護程序保持活動:當它不起作用時重新啟動它。也許,連接檢查?
Nagios 可以使用事件處理程序完成這兩項任務,不過對於 renice,我可能寧願讓它自己執行,因為如果伺服器負載不足,通過 ssh 之類的檢查可能會超時。理想情況下,守護程序有自己的控制項來防止這種情況發生,即“最大連接數”。
Any advanced log processing/rotation/parsing tools?
我喜歡 logrotate 進行日誌輪換,這是非常標準的。對於處理,如果您負擔得起,或者不需要付費版本提供的功能,我喜歡 Splunk。
Handy error notifications: e-mail, icq, jabber, ...
要添加到您的列表中,很多人喜歡文本 (SMS) 消息。