Xen
Oracle VM 2.2 節點無明顯原因重啟
我有一個簡單的四節點 Oracle VM 環境。一個在 vmware 中執行的管理伺服器、一個用於共享儲存的 nfs 伺服器和兩個執行實際管理程序的 Oracle VM 伺服器。
由於某種原因,執行池主服務的節點會突然重新啟動,沒有明顯的原因。我相當確定這是一個軟體問題,可能是某種集群看門狗。需要明確的是,重新啟動的是 vm 伺服器/管理程序,而不是客戶機。
有沒有人看到類似的問題,或者對我應該從哪裡開始尋找根本原因有任何建議?
我在 /var/log/ovs*/ 日誌中沒有看到任何可疑的東西,我還應該看看其他地方嗎?
Oracle 的文件還有一些不足之處。
結果表明節點沒有正確通信,因為節點主機名列在 /etc/hosts 中的環回地址上。集群服務會靜默強制重啟以保護共享儲存。
我不確定您是否有虛擬機管理附帶的精美圖表。如果您這樣做,它們確實可以深入了解記憶體、cpu 和磁碟正在做什麼。也許可能有一些相關性?從那裡您可以開始查看 top 和 ps 以查看伺服器反彈時正在執行和使用的內容。
您還可以將伺服器設置為調試模式嗎?他們支持嗎?
我希望這至少可以幫助您入門。