Hard-Drive
syslog 中的這些磁碟錯誤是什麼意思?
我剛剛在一段時間內第一次重新啟動了我的監控伺服器,然後開始填充螢幕:
Jul 11 23:52:30 monit kernel: [ 25.255908] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 Jul 11 23:52:30 monit kernel: [ 25.256170] ata1.00: BMDMA stat 0x24 Jul 11 23:52:30 monit kernel: [ 25.256278] ata1.00: failed command: READ DMA Jul 11 23:52:30 monit kernel: [ 25.256410] ata1.00: cmd c8/00:c0:20:68:35/00:00:00:00:00/e0 tag 0 dma 98304 in Jul 11 23:52:30 monit kernel: [ 25.256416] res 51/40:9f:41:68:35/00:00:00:00:00/e0 Emask 0x9 (media error) Jul 11 23:52:30 monit kernel: [ 25.256809] ata1.00: status: { DRDY ERR } Jul 11 23:52:30 monit kernel: [ 25.256933] ata1.00: error: { UNC } Jul 11 23:52:30 monit kernel: [ 25.304388] ata1.00: configured for UDMA/66 Jul 11 23:52:30 monit kernel: [ 25.304430] ata1: EH complete . . . Jul 11 23:52:30 monit kernel: [ 25.552451] sd 0:0:0:0: [sda] Unhandled sense code Jul 11 23:52:30 monit kernel: [ 25.552462] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Jul 11 23:52:30 monit kernel: [ 25.552475] sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor] Jul 11 23:52:30 monit kernel: [ 25.552490] Descriptor sense data with sense descriptors (in hex): Jul 11 23:52:30 monit kernel: [ 25.552498] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Jul 11 23:52:30 monit kernel: [ 25.552529] 00 35 68 41 Jul 11 23:52:30 monit kernel: [ 25.552543] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed Jul 11 23:52:30 monit kernel: [ 25.552559] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 00 35 68 20 00 00 c0 00 Jul 11 23:52:30 monit kernel: [ 25.552587] end_request: I/O error, dev sda, sector 3500097 Jul 11 23:52:30 monit kernel: [ 25.556607] ata1: EH complete
我已經知道我需要更換硬碟(數據成本 > 硬碟成本),但我想以我自己的知識了解它到底有什麼問題。
是的,我們的監控伺服器沒有RAID,只有一個HDD……別看我……
sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
看起來驅動器有壞扇區並且無法重新分配這些扇區(可能是因為它的備用扇區用完了)。的輸出
smartctl -a /dev/sda
將為您提供有關驅動器狀態的更多資訊。
Lassie 會說“arf!arf arf!arf!”。這是愚蠢的,因為這與蒂米或威爾斯**無關。這就是為什麼您不接受狗的系統管理員建議的原因。
驅動器給你一個“未恢復的讀取錯誤 - 自動重新分配失敗”,這基本上意味著“我試圖讀取,我失敗了,我試圖恢復(多讀幾次扇區,應用一些 ECC,然後將數據移動到一個沒有被破壞的部門),它沒有工作”。這可能意味著(正如 mgorven 所說)磁碟已經充滿了重新分配的扇區,因為磁碟已經死了一段時間,但我也認為這可能意味著它根本無法恢復該扇區(重複讀取+ ECC 未能獲得好看的數據塊)。
無論哪種方式,是的,驅動器非常非常仙人掌。您的數據看起來也不健康。