Centos5

如何在沒有 KVM 的情況下記錄核心崩潰

  • December 4, 2012

我的伺服器崩潰了,我找不到答案。這一切都是在我的數據中心將 RAM 從 16 GB 升級到 32 GB 之後開始的。

我還在 dmesg 中發現了這樣的日誌——它們在第一次核心恐慌之前就開始出現了:

EXT4-fs error (device md2): ext4_ext_find_extent: bad header/extent in inode #97911179: invalid magic - magic 5f69, entries 28769, max 26988(0), depth 24939(0)
EXT4-fs error (device md2): ext4_ext_remove_space: bad header/extent in inode #97911179: invalid magic - magic 5f69, entries 28769, max 26988(0), depth 24939(0)
EXT4-fs error (device md2): ext4_mb_generate_buddy: EXT4-fs: group 20974: 8589 blocks in bitmap, 54896 in gd
JBD: Spotted dirty metadata buffer (dev = md2, blocknr = 0). There's a risk of filesystem corruption in case of system crash.
EXT4-fs error (device md2): ext4_ext_split: inode #97911179: (comm pdflush) eh_entries 28769 != eh_max 26988!
EXT4-fs (md2): delayed block allocation failed for inode 97911179 at logical offset 1039 with max blocks 1 with error -5

This should not happen!!  Data will be lost
EXT4-fs error (device md2): ext4_mb_generate_buddy: EXT4-fs: group 21731: 5 blocks in bitmap, 60762 in gd
JBD: Spotted dirty metadata buffer (dev = md2, blocknr = 0). There's a risk of filesystem corruption in case of system crash.

我的系統是 CentOS 5.8 64 位,最新核心 2.6.18-308.20.1.el5。在沒有訪問 KVM 的情況下如何檢查核心崩潰的原因是什麼?

我已經告訴我的數據中心管理員檢查伺服器中的記憶體。

您可能會在另一台機器上看到 UDP 記錄的“netconsole”包,核心以暴力模式(不是系統日誌)記錄。在伺服器上,您應該安裝 netconsole 並要求它導出到基於 ’nc’ 的日誌伺服器,例如。在核心崩潰的情況下,所有資訊都記錄在日誌機器上,您可以開始分析發生了什麼

引用自:https://serverfault.com/questions/454730