儲存空間故障磁碟 - 卷離線
在我們推送到磁帶之前,我們已經設置了一個廉價的物理伺服器,其中包含一堆 3TB 磁碟用作備份暫存區域。我們已經安裝了 Windows Server 2012 R2 並設置了儲存空間/池。我們使用 Veeam 備份到在光纖通道上執行的速度更快的伺服器,然後使用腳本將早於 x 天的備份移動到我們的 Storage Spaces 伺服器。
我們最初遇到了一些失敗,因為我們發現使用 Robocopy 通過 UNC 路徑移動數據並沒有優雅地關閉 SMB 連接。我們通過在腳本中添加 net use 然後 net use /delete 解決了這個問題(然後使用驅動器號作為 Robocopy 目標)。這在過去一兩週內效果很好。
今天早上雖然腳本報告失敗。經過調查,我發現了一系列事件 ID 51 警告,然後是事件 ID 134(來自源 ReFS)。在我看來,這就像儲存池中的物理磁碟發生故障。但是,在伺服器管理器中查看,它顯示虛擬磁碟/卷/不太確定如何將其稱為“離線”;只需將其重新聯機即可,並且儲存池中沒有發生故障的物理磁碟。還有兩個熱備件,這些都沒有被交換。
我很好奇這裡發生了什麼?還有為什麼音量下線了?我認為 ReFS 和儲存池的全部意義在於在發生此類故障時提供依賴?
編輯:在下面添加所有相關日誌。
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="disk" /> <EventID Qualifiers="32772">51</EventID> <Level>3</Level> <Task>0</Task> <Keywords>0x80000000000000</Keywords> <TimeCreated SystemTime="2014-12-23T22:13:12.704827200Z" /> <EventRecordID>23901</EventRecordID> <Channel>System</Channel> <Computer>****</Computer> <Security /> </System> <EventData> <Data>\Device\Harddisk25\DR25</Data> <Binary>040080000100000000000000330004802D0100006B0400C000000000000000000000000000000000FC8F470200000000FFFFFFFF0100000058000030020000000020101280032040000080003C000000000020AB09E0FFFF783583D201E0FFFF0000000000000000507383D201E0FFFF30C99FC108E0FFFF6B0400C0000000008A00000000027C288D60000008000000000000000000000000000000000000000000000000000000</Binary> </EventData> </Event>
在分頁操作期間在設備 \Device\Harddisk25\DR25 上檢測到錯誤。
僅供參考 Disk25 是儲存空間創建的虛擬磁碟,而不是物理磁碟之一
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="ReFS" Guid="{036647D2-2FB0-4E32-8349-3F5C19C16E5E}" /> <EventID>134</EventID> <Version>0</Version> <Level>2</Level> <Task>0</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2014-12-23T22:13:13.329846900Z" /> <EventRecordID>23902</EventRecordID> <Correlation /> <Execution ProcessID="4" ThreadID="31267444" /> <Channel>System</Channel> <Computer>*****</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="VolumeIdLength">2</Data> <Data Name="VolumeId">D:</Data> <Data Name="FailureReason">0xc000000e</Data> </EventData> </Event>
文件系統無法將元數據寫入媒體支持卷 D:。寫入失敗,狀態為“指定了不存在的設備”。ReFS 將使卷離線。它可能會自動重新安裝。
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event"> <System> <Provider Name="Microsoft-Windows-StorageSpaces-Driver" Guid="{595F7F52-C90A-4026-A125-8EB5E083F15E}" /> <EventID>304</EventID> <Version>0</Version> <Level>3</Level> <Task>0</Task> <Opcode>0</Opcode> <Keywords>0x8000000000000000</Keywords> <TimeCreated SystemTime="2014-12-30T23:43:40.519688500Z" /> <EventRecordID>21</EventRecordID> <Correlation /> <Execution ProcessID="4" ThreadID="3723912" /> <Channel>Microsoft-Windows-StorageSpaces-Driver/Operational</Channel> <Computer>****</Computer> <Security UserID="S-1-5-18" /> </System> <EventData> <Data Name="Id">{DE94C7EF-6A25-11E4-80B7-647002019326}</Data> </EventData> </Event>
虛擬磁碟 {de94c7ef-6a25-11e4-80b7-647002019326} 處於降級狀態。當託管虛擬磁碟的物理磁碟發生故障、斷開連接或遇到寫入錯誤時,可能會發生這種情況。
Windows 將嘗試修復虛擬磁碟。此時無需執行任何操作。
在與 Microsoft 支持工程師進行了長時間的電子郵件討論後,我們最終安裝了以下匯總更新:
http://support.microsoft.com/kb/2887595
這包括似乎專門針對此問題的更新:
https://support.microsoft.com/en-us/kb/2897150
自安裝匯總更新以來,該卷始終保持線上狀態,沒有任何問題。
假設您肯定使用了容錯模式,例如奇偶校驗或鏡像,那麼該錯誤應該是不可能的。我能夠使用我知道是壞的磁碟在條帶設置中重現該錯誤。因此,要麼您已準備好進行條帶化,要麼您發現了一個錯誤。如果您還沒有的話,我會在這一點上讓微軟參與進來。