Linux

物理辨識故障硬碟

  • July 1, 2019

因此,假設您的伺服器有 6 個健康的硬碟驅動器。驅動器出現故障(不會安裝/檢測,因錯誤退​​出 RAID)或出現故障(SMART 變得更糟等)。您需要更換壞驅動器。當您打開機箱時,您會看到……六個相同的硬碟驅動器。

你怎麼知道哪一個不再健康/安裝/功能?

系統將是 linux,很可能是 ubuntu 伺服器,最多使用簡單的軟體 RAID。硬碟驅動器將是 SATA 並直接連接到主機板。(沒有突襲控制器)

在選擇正確的驅動器之前,我不想隨機斷開驅動器。驅動器對我來說都一樣;我想有一些常見的方法可以辨識我不知道的驅動器。有沒有人有任何指示/提示/最佳實踐?謝謝!

編輯:我曾希望以一種隨意的方式將其“概括”,但它只是以“不完整”和“可怕”的形式出現。我的錯!

就像您解釋的那樣,我在(塔式)伺服器上遇到了這個確切的問題,這很容易:

smartctl 將輸出驅動器的序列號

供應商有時會發布他們自己的特定工具,例如 hdparm,它們也能做到這一點。

所以輸出壞驅動的序列號,然後用牙醫的鏡子和手電筒找到驅動。

在機架上,您通常會像其他人所說的那樣擁有指示燈,但我敢打賭同樣適用。

在驅動器上貼標籤(取決於托盤的設計)可能不可行。到驅動器當機時,貼紙可能會變乾並脫落。

ledctl(來自ledmon包)確實是解決這個問題的方法。

ledctl locate=/dev/disk/by-id/[drive-id]

要麼

ledctl locate=/dev/sda

將點亮您機箱上指定驅動器的驅動器故障指示燈。我提供了兩個範例來說明如何辨識驅動器並不重要。您可以使用序列號、名稱等…您可以使用的任何資訊。在 /dev/ 和 /dev/disk/ 路徑下以多種方式引用驅動器。

要關閉燈,只需再次執行它,將 locate 更改為 locate_off ,如下所示:

ledctl locate_off=/dev/sda

引用自:https://serverfault.com/questions/64239