Best-Practices
每日/每週/每月/每年的系統管理員任務
這應該是社區維基。我正在嘗試列出我們應該定期執行的所有系統管理員任務的列表,因為我認為我們在公司做得還不夠。這裡的態度是解決問題不方便,但我們沒有時間進行預防性維護或持續改進。
日常:
- 交換夜間備份磁帶/驅動器
- 檢查防病毒更新是否已推送到所有系統
每週:
- 每週交換備份磁帶/驅動器
- 從所有系統中清除臨時文件
- 對所有系統進行碎片整理
每月:
- 計劃基礎設施改進
- 將過時的設備傳遞/發送到電子回收商
- 重建或更換老化的工作站
- 測試從備份還原
年度的:
- 重建或更換老化的伺服器
- 更換 UPS 電池
如果您沒有足夠的時間進行預防性維護並花費大部分時間來解決問題,那麼您的整個方法都需要修改。我不會告訴你每個時期應該做什麼,而是給你一些想法,這樣你就不必做事了。
拳頭你需要一個好的監控系統和盡可能多的自動化管理。這兩個項目應該比許多管理員意識到的要釋放更多的時間,直到他們設置好之後。
您的監控系統應該為您做的一些事情是:
- 當郵件或垃圾郵件過濾器隊列變得太大或太突然時提醒您。
- 當驅動器空間過低、CPU 使用率過高等時提醒您。
- 記錄諸如磁碟使用率之類的事情,這樣您就可以看到一段時間內的趨勢。
- 郵箱也是一樣。
- 當防火牆記錄異常數量的命中時提醒您。
- 任何服務於外部世界的東西也是如此。例如 DNS 和 Web 伺服器。
- 如果任何機器關閉或解除安裝了 AV 軟體,則在 AV 更新太舊時提醒您。
碎片整理甚至不應該出現在您的任務列表中,因為它應該是一個自動化的過程。在您希望的時間間隔讓伺服器在重新啟動後執行磁碟檢查和碎片整理。考慮將其與系統綁定以安裝排隊更新和更新檔(之前已在非生產機器上測試過)。
臨時文件夾也可以自動清理。我創建了一個簡單的應用程序,它在重啟後觸發,等待 10 分鐘,然後清除所有臨時位置。延遲是為了確保它不會刪除重新啟動後完成的安裝或升級可能需要的文件(很難學到!)。
您必須在適合您的任何時間段手動執行的一件事是監控監控系統和自動化,以確保安全。我每天檢查我的,但實際上已經一年多沒有遇到問題了。
當您確實讓您的系統和自動化執行時,請確保您也有一個版本控制系統可以將其放入。發現最後一個小調整破壞了其他東西可能真的很煩人,但您無法確切記得您更改了什麼。