Oracle

如何從 OVM 伺服器的斷電中恢復

  • August 5, 2013

我們在使用 Oracle VM 平台託管大約 10 多個虛擬機的物理伺服器上出現 UPS 錯誤並斷電。我們讓它恢復執行,但我想知道從中恢復的最佳方法是什麼。具體來說,我想知道我們是否需要在每個單獨的 VM 上執行 fsck,和/或我們是否應該在平台級別執行 fsck?我們的系統管理員最近辭職了,我更像是一名程序員而不是系統管理員,所以這有點超出我的能力。我一直在查看 OVM 文件(OVM Manager 3.2.1),但似乎找不到任何關於處理這種情況的具體內容。我很感激任何能給我指明正確方向的人。

理想情況下,您應該fsck每個 VM 的文件系統。您應該在單使用者模式下執行 VM,或者從網路或 CD 映像引導來執行此操作。如果要在單使用者模式下啟動 VM,請執行以下操作:

  1. 以 root 身份登錄到 VM 伺服器。
  2. 找到虛擬機的配置文件。我通常使用 grep 獲取 VM 名稱:
grep -r vm_name /OVS/Repositories/*
  1. 使用 Xen 工具手動啟動 VM,而不是從 OVM Manager 啟動,連接到控制台:
xm create -c <path_from_above>
  1. 出現GRUB菜單時,編輯引導選項。你還沒有說你的虛擬機正在執行什麼發行版,但假設一些類似 RHEL(RHEL、CentOS、OEL)的東西,我會刪除選項rhgbquiet添加single console=xvc0. 該single選項告訴 init 啟動單使用者,console=xvc0告訴核心xvc0用作控制台設備。這是 Xen 控制台,您可以通過 Oracle VM Manager 訪問它。

一旦你啟動到單使用者,你就可以fsck文件系統。但是,您不應嘗試 fsck 根文件系統或任何其他已掛載的文件系統。只要解除安裝了使用者/數據文件系統,就可以安全地對其進行檢查。不過,您可以執行fsck -n以檢查根文件系統是否存在錯誤。如果這確實報告了錯誤,您應該網路引導或 CD 引導 VM 並fsck從那裡執行,這樣文件系統就不會被掛載。

引用自:https://serverfault.com/questions/528806