Hard-Drive

syslog 中的這些磁碟錯誤是什麼意思?

  • October 25, 2017

我剛剛在一段時間內第一次重新啟動了我的監控伺服器,然後開始填充螢幕:

Jul 11 23:52:30 monit kernel: [   25.255908] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 11 23:52:30 monit kernel: [   25.256170] ata1.00: BMDMA stat 0x24
Jul 11 23:52:30 monit kernel: [   25.256278] ata1.00: failed command: READ DMA
Jul 11 23:52:30 monit kernel: [   25.256410] ata1.00: cmd c8/00:c0:20:68:35/00:00:00:00:00/e0 tag 0 dma 98304 in
Jul 11 23:52:30 monit kernel: [   25.256416]          res 51/40:9f:41:68:35/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 11 23:52:30 monit kernel: [   25.256809] ata1.00: status: { DRDY ERR }
Jul 11 23:52:30 monit kernel: [   25.256933] ata1.00: error: { UNC }
Jul 11 23:52:30 monit kernel: [   25.304388] ata1.00: configured for UDMA/66
Jul 11 23:52:30 monit kernel: [   25.304430] ata1: EH complete

. . . 

Jul 11 23:52:30 monit kernel: [   25.552451] sd 0:0:0:0: [sda] Unhandled sense code
Jul 11 23:52:30 monit kernel: [   25.552462] sd 0:0:0:0: [sda]  Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jul 11 23:52:30 monit kernel: [   25.552475] sd 0:0:0:0: [sda]  Sense Key : Medium Error [current] [descriptor]
Jul 11 23:52:30 monit kernel: [   25.552490] Descriptor sense data with sense descriptors (in hex):
Jul 11 23:52:30 monit kernel: [   25.552498]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Jul 11 23:52:30 monit kernel: [   25.552529]         00 35 68 41 
Jul 11 23:52:30 monit kernel: [   25.552543] sd 0:0:0:0: [sda]  Add. Sense: Unrecovered read error - auto reallocate failed
Jul 11 23:52:30 monit kernel: [   25.552559] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 00 35 68 20 00 00 c0 00
Jul 11 23:52:30 monit kernel: [   25.552587] end_request: I/O error, dev sda, sector 3500097
Jul 11 23:52:30 monit kernel: [   25.556607] ata1: EH complete

我已經知道我需要更換硬碟(數據成本 > 硬碟成本),但我想以我自己的知識了解它到底有什麼問題。

是的,我們的監控伺服器沒有RAID,只有一個HDD……別看我……

sd 0:0:0:0: [sda]  Add. Sense: Unrecovered read error - auto reallocate failed

看起來驅動器有壞扇區並且無法重新分配這些扇區(可能是因為它的備用扇區用完了)。的輸出smartctl -a /dev/sda將為您提供有關驅動器狀態的更多資訊。

Lassie 會說“arf!arf arf!arf!”。這是愚蠢的,因為這與蒂米或威爾斯**無關。這就是為什麼您不接受狗的系統管理員建議的原因。

驅動器給你一個“未恢復的讀取錯誤 - 自動重新分配失敗”,這基本上意味著“我試圖讀取,我失敗了,我試圖恢復(多讀幾次扇區,應用一些 ECC,然後將數據移動到一個沒有被破壞的部門),它沒有工作”。這可能意味著(正如 mgorven 所說)磁碟已經充滿了重新分配的扇區,因為磁碟已經死了一段時間,但我也認為這可能意味著它根本無法恢復該扇區(重複讀取+ ECC 未能獲得好看的數據塊)。

無論哪種方式,是的,驅動器非常非常仙人掌。您的數據看起來也不健康。

引用自:https://serverfault.com/questions/407007