Maintenance

有哪些方法可以與您的團隊協調伺服器維護資訊?

  • May 20, 2015

我所在的團隊負責協調我們公司某些伺服器的維護活動和其他一些活動。現在團隊中的人員越來越多,我們負責的伺服器也越來越多,因此跟踪與維護某些伺服器相關的問題或提示變得越來越困難。

我想知道是否有任何工具或方法可以使此類資訊的協調更容易?我嘗試了一些錯誤跟踪工具,但這些工具非常針對問題和錯誤。現在我們會在每次活動後發送電子郵件摘要,但如果有新人加入團隊,他們將不會擁有該歷史記錄。我還考慮了一個 wiki,但這對於這種類型的記錄保存來說似乎很尷尬。

例如,對於伺服器 a、b 和 c,我想跟踪這樣一個事實,即在重新啟動之前,服務 1、2 和 3 需要在重新啟動之前關閉。如果伺服器 b 和 c 上發生升級,我想要一種方法來跟踪升級期間出現的問題。這樣,一段時間後,如果團隊中的另一個人將參與伺服器“b”的某些維護活動,他們可以看到與該伺服器相關的所有歷史記錄。

任何提示或解決方案將不勝感激。

我用了兩種方法:

1) Wiki 我們是Google應用企業使用者,我們使用“站點”功能作為我們的 wiki。當然,鎖定以便只有域使用者才能看到它(如果需要,您可以得到更具體的資訊)。

每個伺服器在 wiki 中有兩個頁面。一頁是規格、用法和關鍵說明,一頁是活動日誌。日誌是日期、時間、任務和重啟指示器的表格。理想情況下,不會發生任何不被記錄的事情!

旁注:Google的“網站”使得使用他們的“列表”模板很容易創建日誌頁面。

2) WhatsUp Pro

我使用 WhatsUp 來監控我的伺服器和設備。在有用的地方,我在設備的自由格式註釋欄位中添加了關鍵資訊(“記得啟動服務 x”或“確保介面 A 出現”)。然後,當值班人員被尋呼(通過 SMS)時,文本會包含這些註釋。非常方便。

引用自:https://serverfault.com/questions/58047