Esxi 5.1 Core Dump 導致 Server 2012 VM 性能不佳;斷開外部 iSCSI 數據儲存後確定
我有一台執行 esxi 5.1 和 16GB 記憶體的戴爾 R510;1 個 CPU(Xeon L5520 @ 2.27HGz;4 核)執行單個 Server 2012 機器。我今天早上來這裡
核心轉儲。我按住電源按鈕並重新啟動。它回到“VMWARE 恢復”螢幕,10 到 20 分鐘後,我回來了,它又回到了通常的螢幕(Vmware 資訊;IP 地址管理資訊等),機器上的單個伺服器已自行啟動備份。問題是,從那以後,它似乎非常緩慢。伺服器似乎還可以;性能監視器從來沒有達到最大值。似乎最常用的是網路;我只使用了一個 NIC(我們總共有大約 10 個使用者訪問伺服器上的數據文件,它正在執行 DNS、AD 和 DHCP 服務)。我已經更換了一個開關,認為它可能是罪魁禍首,但仍然有相同的結果。偶爾,我與伺服器的 RDP 會話會失去,但最終會恢復。
關於在哪裡尋找放緩的罪魁禍首的任何想法?關於我可以嘗試提高性能的任何想法?單個 NIC 是否足以支持 10 個使用者的文件共享(我們主要使用 Quicken 文件,以及 office xls/word)並不太密集。
我曾經嘗試添加另一個 NIC 並“組合”它們,但它破壞了一切,我很難回去改變事情,因為“組合”的 nic 決定使用 dhcp,而我無法訪問 dhcp 伺服器來查找地址(因為伺服器是 dhcp 伺服器)。
感謝您的任何想法。
更新
此後,我已將伺服器從網路中移出並將其移至另一個位置。自從它脫網以來,它一直執行良好(nb 在我脫網之前,還有一個與圖片中相同的核心轉儲)。這可能是外部映射 iSCSI 數據儲存的結果嗎?我在主機上有 2 個錯誤,vmkernel 日誌中有關於它無法登錄的錯誤,但至少有一些錯誤是已知的:https ://kb.vmware.com/s/article/1031221但不是肯定別人。以下是 vmkernel 錯誤的幾個鏡頭:https ://imgur.com/a/DOA3umn
此外,這裡是 vmkernel.log 中最新的 pastebin。我還可以上傳 syslog、usb、vmkeventd、vmksummary、vmkwarning、vprobed 和 vpxa.log 文件。https://pastebin.com/rmp3k1G5
更新 2
我已經讓機器在周末執行,到目前為止,它仍然執行良好。沒有恐慌,沒有崩潰。想知道以某種方式通過 iSCSI 映射為數據儲存的外部 NAS 設備可能是cuplrit嗎?特別令人擔憂,因為我也將它們放在其他幾個主機上……
堆棧跟踪以 megasas 結尾,這意味著您的 MegaRAID(您可能有一些 RAID 陣列)的命令可能意外失敗,或者是驅動程序錯誤。我建議將 MegaRAID 韌體與 ESXi 驅動程序一起更新(可能還有 ESXi 本身)。ESXi 5.1 很古老,但您仍然可以從 VMware 站點獲取更新和非同步驅動程序。
我的直覺告訴我儲存出了點問題——這也可以解釋由非常高的磁碟延遲引起的緩慢(你應該在 PerfMon 或 Resource Monitor 或 vSphere Client 監控中看到它)。在 megacli/storcli 中檢查 RAID 和磁碟狀態或重新啟動到 WebBIOS 以檢查陣列和驅動器狀態。