Windows-Server-2012-R2

儲存空間故障磁碟 - 卷離線

  • May 29, 2019

在我們推送到磁帶之前,我們已經設置了一個廉價的物理伺服器,其中包含一堆 3TB 磁碟用作備份暫存區域。我們已經安裝了 Windows Server 2012 R2 並設置了儲存空間/池。我們使用 Veeam 備份到在光纖通道上執行的速度更快的伺服器,然後使用腳本將早於 x 天的備份移動到我們的 Storage Spaces 伺服器。

我們最初遇到了一些失敗,因為我們發現使用 Robocopy 通過 UNC 路徑移動數據並沒有優雅地關閉 SMB 連接。我們通過在腳本中添加 net use 然後 net use /delete 解決了這個問題(然後使用驅動器號作為 Robocopy 目標)。這在過去一兩週內效果很好。

今天早上雖然腳本報告失敗。經過調查,我發現了一系列事件 ID 51 警告,然後是事件 ID 134(來自源 ReFS)。在我看來,這就像儲存池中的物理磁碟發生故障。但是,在伺服器管理器中查看,它顯示虛擬磁碟/卷/不太確定如何將其稱為“離線”;只需將其重新聯機即可,並且儲存池中沒有發生故障的物理磁碟。還有兩個熱備件,這些都沒有被交換。

我很好奇這裡發生了什麼?還有為什麼音量下線了?我認為 ReFS 和儲存池的全部意義在於在發生此類故障時提供依賴?

編輯:在下面添加所有相關日誌。

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
 <Provider Name="disk" /> 
 <EventID Qualifiers="32772">51</EventID> 
 <Level>3</Level> 
 <Task>0</Task> 
 <Keywords>0x80000000000000</Keywords> 
 <TimeCreated SystemTime="2014-12-23T22:13:12.704827200Z" /> 
 <EventRecordID>23901</EventRecordID> 
 <Channel>System</Channel> 
 <Computer>****</Computer> 
 <Security /> 
 </System>
<EventData>
 <Data>\Device\Harddisk25\DR25</Data> 
 <Binary>040080000100000000000000330004802D0100006B0400C000000000000000000000000000000000FC8F470200000000FFFFFFFF0100000058000030020000000020101280032040000080003C000000000020AB09E0FFFF783583D201E0FFFF0000000000000000507383D201E0FFFF30C99FC108E0FFFF6B0400C0000000008A00000000027C288D60000008000000000000000000000000000000000000000000000000000000</Binary> 
 </EventData>
 </Event>

在分頁操作期間在設備 \Device\Harddisk25\DR25 上檢測到錯誤。

僅供參考 Disk25 是儲存空間創建的虛擬磁碟,而不是物理磁碟之一

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
 <Provider Name="ReFS" Guid="{036647D2-2FB0-4E32-8349-3F5C19C16E5E}" /> 
 <EventID>134</EventID> 
 <Version>0</Version> 
 <Level>2</Level> 
 <Task>0</Task> 
 <Opcode>0</Opcode> 
 <Keywords>0x8000000000000000</Keywords> 
 <TimeCreated SystemTime="2014-12-23T22:13:13.329846900Z" /> 
 <EventRecordID>23902</EventRecordID> 
 <Correlation /> 
 <Execution ProcessID="4" ThreadID="31267444" /> 
 <Channel>System</Channel> 
 <Computer>*****</Computer> 
 <Security UserID="S-1-5-18" /> 
 </System>
<EventData>
 <Data Name="VolumeIdLength">2</Data> 
 <Data Name="VolumeId">D:</Data> 
 <Data Name="FailureReason">0xc000000e</Data> 
 </EventData>
 </Event>

文件系統無法將元數據寫入媒體支持卷 D:。寫入失敗,狀態為“指定了不存在的設備”。ReFS 將使卷離線。它可能會自動重新安裝。

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
 <Provider Name="Microsoft-Windows-StorageSpaces-Driver" Guid="{595F7F52-C90A-4026-A125-8EB5E083F15E}" /> 
 <EventID>304</EventID> 
 <Version>0</Version> 
 <Level>3</Level> 
 <Task>0</Task> 
 <Opcode>0</Opcode> 
 <Keywords>0x8000000000000000</Keywords> 
 <TimeCreated SystemTime="2014-12-30T23:43:40.519688500Z" /> 
 <EventRecordID>21</EventRecordID> 
 <Correlation /> 
 <Execution ProcessID="4" ThreadID="3723912" /> 
 <Channel>Microsoft-Windows-StorageSpaces-Driver/Operational</Channel> 
 <Computer>****</Computer> 
 <Security UserID="S-1-5-18" /> 
 </System>
<EventData>
 <Data Name="Id">{DE94C7EF-6A25-11E4-80B7-647002019326}</Data> 
 </EventData>
 </Event>

虛擬磁碟 {de94c7ef-6a25-11e4-80b7-647002019326} 處於降級狀態。當託管虛擬磁碟的物理磁碟發生故障、斷開連接或遇到寫入錯誤時,可能會發生這種情況。

Windows 將嘗試修復虛擬磁碟。此時無需執行任何操作。

在與 Microsoft 支持工程師進行了長時間的電子郵件討論後,我們最終安裝了以下匯總更新:

http://support.microsoft.com/kb/2887595

這包括似乎專門針對此問題的更新:

https://support.microsoft.com/en-us/kb/2897150

自安裝匯總更新以來,該卷始終保持線上狀態,沒有任何問題。

假設您肯定使用了容錯模式,例如奇偶校驗或鏡像,那麼該錯誤應該是不可能的。我能夠使用我知道是壞的磁碟在條帶設置中重現該錯誤。因此,要麼您已準備好進行條帶化,要麼您發現了一個錯誤。如果您還沒有的話,我會在這一點上讓微軟參與進來。

引用自:https://serverfault.com/questions/654488