Raid

LSI MegaRAID SAS 9261-8i:更換後無法辨識磁碟

  • March 6, 2022

我有一個 Supermicro 伺服器,裡面有一個 LSI MegaRAID SAS 9261-8i Raid 控制器。控制器連接了 3 個磁碟,配置為 RAID5 陣列。其中一個磁碟最近出現故障(RAID 顯示為降級),在檢查 SMART 資訊後發現必須更換。

我使用 storcli 將驅動器標記為失去,並刪除了驅動器以運送給供應商。現在磁碟的替代品到了,我將它插入 RAID 控制器,但沒有任何反應。這就是 storcli 所說的:

storcli /c0 show

TOPOLOGY :
========

------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT     Size PDC  PI SED DS3  FSpace 
------------------------------------------------------------------------
0 -   -   -        -   RAID5 Dgrd  N  5.456 TB dflt N  N   none Y      
0 0   -   -        -   RAID5 Dgrd  N  5.456 TB dflt N  N   none Y      
0 0   0   -        -   DRIVE Msng  -  2.728 TB -    -  -   -    -      
0 0   1   252:5    14  DRIVE Onln  N  2.728 TB dflt N  N   none -      
0 0   2   252:2    11  DRIVE Onln  N  2.728 TB dflt N  N   none -      
------------------------------------------------------------------------

如您所見,插槽 2 和 5 中的兩個驅動器都線上,並且設備組 (DG) 的另一個驅動器被標記為失去。第三個驅動器曾經在插槽 0 中,而替換現在在插槽 1 中。但是控制器無法辨識新驅動器,您也可以在物理設備列表中看到(來自與上述相同命令的輸出):

Physical Drives = 2

PD LIST :
=======

-----------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                  Sp 
-----------------------------------------------------------------------------
252:2    11 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD3000FYYZ-01UL1B0 U  
252:5    14 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD3000FYYZ-01UL1B0 U  
-----------------------------------------------------------------------------

與此相反,請參閱以下輸出:

storcli /c0/pall show

PhyInfo :
=======

----------------------------------------------------------------------------
PhyNo SAS_Addr           Phy_Identifier Link_Speed Device_Type  Description 
----------------------------------------------------------------------------
   0 0x0000000000000000              0 No limit   -            -           
   1 0x4433221101000000              0 No limit   End Device   -           
   2 0x0000000000000000              0 No limit   -            -           
   3 0x0000000000000000              0 No limit   -            -           
   4 0x4433221104000000              0 No limit   End Device   -           
   5 0x0000000000000000              0 No limit   -            -           
   6 0x4433221106000000              0 No limit   End Device   -           
   7 0x0000000000000000              0 No limit   -            -           
----------------------------------------------------------------------------

我猜那PhyNo 1是更換的驅動器,但這是我可以找到它的唯一命令。所有 Slot 特定的命令Slot 1都以 . 結尾Drive not found

有什麼想法嗎?我在第二台伺服器上測試了更換的驅動器,該伺服器的設置完全相同(也是相同的 RAID 控制器),控制器檢測到驅動器立即標記為UGoodwhich mean Unconfigured Good,所以它不可能是驅動器錯誤。我還進行了一些重新啟動,關閉了幾分鐘並嘗試在啟動時使用 LSI MegaRaid BIOS 來檢測新驅動器,但沒有成功。驅動器未顯示在 LSI MegaRaid BIOS 引導消息中。

任何提示將不勝感激。

事實證明,這種行為是由飢餓的 HDD引起的- 這是被替換的 HDD。我沒有得到它,因為第二台服​​務器可以毫無問題地辨識新硬碟,但也許這是這個原始硬碟的最後一口氣。

我沒想到數據中心級硬碟驅動器(WD RE 系列,在您問之前)到貨時會出現缺陷,在我浪費時間之前,我會在未來意識到這一點。

我今天在我的 9361-8i 上遇到了類似的問題。現有 6 個帶有 Raid6 的磁碟,當我添加兩個相同的新磁碟時,它只能辨識其中一個。只是無法同時辨識兩個新磁碟。然後,我切換埠以在最後一個插槽號(埠 0-3 和埠 0-2)上製作新磁碟,重新啟動它就可以了!我不知道為什麼,但新磁碟似乎是由最後一個插槽中的 RAID 控制器辨識的。所以你不能將新磁碟放入插槽 1 並將舊磁碟放入插槽 2,然後 raid 控制器僅辨識舊磁碟。

引用自:https://serverfault.com/questions/587925