Windows-Server-2008-R2

虛擬化的 Windows 2008 R2 拋出隨機 BSOD,但不寫入 minidump

  • February 10, 2015

我們在客戶 VMware 託管的 RemoteDesktop 伺服器中遇到隨機 BSOD。藍屏當機幾乎每週都會發生。奇怪的是,虛擬機沒有寫入任何我們可以分析的轉儲,%systemroot%\minidump 中沒有小型轉儲,也沒有任何完整轉儲。伺服器給我們的唯一提示是它的事件日誌中的一個條目,說它必須重新啟動,因為一個嚴重的錯誤。此日誌條目的詳細資訊顯示 BugCheckCode 252 / 0xFC,即ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY

MSDN問題分析轉儲並查找儲存在KiBugCheckDriver中的故障驅動程序。由於沒有寫入轉儲,我們顯然沒有此選項可用。

故障伺服器是託管在 VMware ESXi 5.5.0 上的 Windows 2008 R2。已安裝和配置的角色是 RemoteDesktopServer、FileServer、Print- 和 Webserver。在同一主機上執行的其他虛擬機似乎不受此問題的影響。

這是我們在事件詳細資訊中獲得的輸出:

BugcheckCode 252 
BugcheckParameter1 0xfffff88001e64fb8 
BugcheckParameter2 0x800000000293e963 
BugcheckParameter3 0xfffff88015c55eb0 
BugcheckParameter4 0x2 
SleepInProgress false 
PowerButtonTimestamp 0 

到目前為止,我們已經嘗試過:

  • 在系統設置中禁用自動重啟。我們只有在客戶完成時間後才能這樣做,因為它是他們正在使用的最高效的伺服器之一。我們為以下所有測試場景禁用了自動重啟:

    • 我們使用 Sysinternals 的 NotMyFault 故意使虛擬機崩潰:BSOD 發生了,對我們來說似乎很“正常”。BSOD 說它已完成將資訊轉儲到磁碟,但是在我們客戶體驗的隨機 BSOD 中,絕對沒有寫入轉儲
    • 我們嘗試手動將 pagefile.sys 的大小設置為不同的大小(最多為 RAM 的 2 倍),結果相同

一些 EventLog 條目似乎根本沒有有價值的資訊:

BugCheckCode 0
BugcheckParameter1 0x0 
BugcheckParameter2 0x0 
BugcheckParameter3 0x0 
BugcheckParameter4 0x0 
SleepInProgress false 
PowerButtonTimestamp 0 

長話短說,主要問題是為什麼絕對沒有轉儲寫入磁碟。分析 BSOD / 轉儲本身應該是解決此錯誤的最有針對性的方法。

如果我可以提供更多資訊或忘記了什麼,請問:)

如果您使用的是 Intel E5 CPU,請查看此知識庫文章: http: //kb.vmware.com/kb/2073791

症狀

在使用 Windows 2008 R2、Red Hat Enterprise Linux 或 Solaris 10 64 位執行虛擬機時,您可能會遇到以下症狀之一: •Windows 2008 R2 藍屏事件:

0x0000000a - IRQL_NOT_LESS_OR_EQUAL 0x0000001a - MEMORY_MANAGEMENT 0x000000fc - ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY

原因

在發佈時(2014 年 9 月 10 日),這些處理器被確定為受到影響: • 命名為 Intel® Xeon® Processor E5-#### v2 的處理器,其中 #### 是一個 4 位數字,可選後面是一封信。• 處理器命名為 Intel® Xeon® Processor E7-#### v2,其中#### 是一個 4 位數字。• 處理器命名為 Intel® Xeon® Processor E3-12## v2,其中 ## 是一個 2 位數字,後跟一個字母可選。

解析度

這是一個影響 VMware ESXi 的已知問題。請聯繫您的供應商為您的硬體更新 BIOS 以解決此問題並提供相關英特爾勘誤表的參考: •CA135 - 啟用 EPT 時 MOV 到 CR3 可能導致勘誤表部分出現意外頁面錯誤或頁面轉換不正確英特爾至強處理器 E5 v2 產品系列文件。•CF124 - 在英特爾至強處理器E7 v2 產品系列文件的勘誤部分啟用EPT 時頁面轉換不正確。

注意:截至 2014 年 7 月 11 日,上述連結正確無誤。如果您發現連結已損壞,請提供回饋,VMware 員工將更新該連結。

如果您的平台沒有可用的 BIOS 更新,請使用以下方法之一解決此問題:

升級:此問題在 ESXi 5.5 Update 2 中得到解決,可從 VMware 下載獲得。有關詳細資訊,請參閱 VMware ESXi 5.5 Update 2 發行說明。

目前,沒有適用於 ESXi 5.1 主機的解決方案。

如果您使用這些 CPU,我建議您升級主機 BIOS 或將 ESXi 升級到版本 5.5 Update 2。

引用自:https://serverfault.com/questions/664861