Google-Compute-Engine
為什麼我的 32 核 GCE 實例一直停止,我該如何調試它?
我正在嘗試使用Google計算引擎(GCE)來執行一些科學/工程軟體。我已經在 GCE 上成功地測試了系統,使用了一個長時間執行的 8 核、非搶占式實例。我現在正在使用 32 核搶占式實例進行測試,但發現該實例在相對較短的時間(當然不到一小時)後停止執行。儘管它是可搶占的,但我從文件中得到的印像是,在典型情況下它相對不太可能被阻止。
我想知道是否有某種方法可以確定實例停止的原因(我沒有看到任何類型的日誌,至少在 Web 界面中),獲取有關原因的建議,以及補救措施或方法的建議防止它。
如果相關,我正在使用免費信用的 GCE 試用期。預設情況下,您最多只能擁有 24 個核心,但我要求將配額增加到 32 個核心,以便可以在此實例類型上測試我的系統。
我將嘗試使用不可搶占的實例執行,看看這是否有什麼不同。稍後我將通過編輯更新此問題以報告此結果。
搶占式 VM 取決於 Google 數據中心的可用容量。一些地區/地區比其他地區/地區更受歡迎(例如 us-central1 比 asia-east1 更受歡迎,並且在較長時間內不太可能出現過剩產能。
如果您可以為您的實例使用其他區域/區域,請嘗試使用其他區域和區域進行試驗,並憑經驗檢查它們是否有更多可用的搶占式實例。
請記住,搶占式實例只能用於無狀態應用程序,否則您的數據或服務將失去。