Service

強制伺服器盡可能空閒(所有作業系統,但也可能是 illumos)

  • February 14, 2021

有時,伺服器會開始顯示某種硬體故障,而不是禁用其功能,但需要親自到場(如果遠端發布,可能需要幾天才能到達)。

在某些這樣的情況下,伺服器必須保持開啟以保留一些內部狀態:它不能關閉電源,也不能重新啟動,但同時,它必須處於盡可能空閒的狀態,並試圖保持開啟直到技術到達。

目前我們手動禁用所有服務,包括數據庫、系統日誌等。有時它們有幾十個,我們必須密切關注打開或關閉的內容。

我知道這一點,但它沒有多大幫助。

有沒有辦法以程式方式執行此操作,記錄啟用的內容,以便在伺服器狀況改善時正確重新啟動此類服務?

我對任何作業系統的答案感興趣,但也可能對基於 illumos 的金屬上作業系統(SmartOS / OmniOS)感興趣,因為這是我們正在使用的設置。

在 Xen 或 VMware 等虛擬機管理程序上執行,您可以選擇拍攝包括 RAM 在內的快照,甚至可以無限期暫停 VM,從而實現您的要求。

您描述的問題聽起來確實像您可以通過採取不同的方法來避免的事情 - 比如避免在有問題的伺服器上保持本地狀態。由於您沒有分享任何有關您操作的環境或為什麼需要此設置的資訊,因此聽起來確實過於復雜且容易失敗。

編輯

您提供的詳細資訊沒有詳細說明“為什麼”。

在某些這樣的情況下,伺服器必須保持開啟以保留一些內部狀態:它不能關閉電源,也不能重新啟動,但同時,它必須處於盡可能空閒的狀態,並試圖保持開啟直到技術到達。

為什麼?

如果您需要它來提供替代品,這就是配置管理的用途(puppet/ansible/cfengine + 像 Foreman 之類的東西)

如果您需要在替換後繼續操作(例如應用程序狀態),請盡可能將其遠離該框。

引用自:https://serverfault.com/questions/1053622