Linux

如何確定伺服器是否已遷移到Google云服務上?

  • March 26, 2018

背景:我有一個由 3 個 linux 虛擬機組成的集群。它們執行相同的配置,並通過Google的網路負載平衡器進行負載平衡。

最近,我注意到其中一台機器上的負載在任何時候都明顯高於其他機器。不是尖峰 CPU,只有 2x-3x 的負載平均值始終如一。

對伺服器的審計沒有發現 rootkit 或惡意軟體。程序列表幾乎相同。所有機器上的記憶體使用都是標稱的。沒有過多的交換。對磁碟的寫入都是名義上的。

通過查看 SQL 數字,機器似乎在過去 2 周處理的相同流量的 0.1% 以內。

查看累積 CPU 時間(通過頂部),我看到這台機器上的 mysql 程序以及其他長時間執行的程序似乎比其他 2 台機器消耗了大約 70% 的 CPU 時間(全部在一個小時內重新啟動) 2週前彼此)。這必須在 3 天的時間內發生,因為此時 CPU 圖表顯示這台機器上的使用率與其他機器相比有所增加。

此外,我注意到通過錯誤日誌與該伺服器的連接似乎激增。它只發生過一次,但大約是 CPU 問題似乎開始的時候。

通過雲控制台關閉伺服器幾分鐘似乎已經解決了這個問題 - 現在。

我目前的假設是,連接峰值是由於實時遷移導致的斷電而發生的,並且 CPU 使用率更高,因為新的管理程序配置不同 - 很可能是由於英特爾前瞻性漏洞的修補程序。

誰能給我指出一個顯示伺服器遷移的日誌,以便我可以確認或排除這個假設的實時遷移部分?

任何其他想法將不勝感激。

您可以從 VM 查詢元數據伺服器以檢查是否即將進行實時遷移並獲得一些提前通知(事件前 60 秒。)

您應該查詢該maintenance-event屬性以找出實時遷移即將發生的時間。

此頁麵包含有關如何查詢此屬性的說明以及一個範例 Python 腳本,您可以調整該腳本以在遷移的情況下採取一些措施。

引用自:https://serverfault.com/questions/904693