Raid
帶有 ext4 的 Ubuntu 10.04 重複出現 IO 錯誤
我們使用(不支持的)Ubuntu 10.04 LTS 安裝了新的 DELL 伺服器。在安裝 Ubuntu 之前,我們使用 DELL 工具配置了硬體 RAID(我認為是 RAID 1)。
伺服器根本沒有負載,一個小型 Postgres 伺服器和一些 Samba 共享處於活動狀態。有時硬碟似乎在歸檔,而 ubuntu 將文件系統掛載為只讀。
重新啟動並執行 fsck 暫時有幫助,但問題一次又一次地出現。
今天我在它發生的時候看到了一條錯誤消息(保存一個大文件到硬碟):
end_request: I/O error, dev sda, sector 0 Aborting journal on device dm-0-8 EXT4-fs error (device dm-0): ext4_journal_start_sb: Detected a (...) journal EXT4-fs (dm-0): Remounting filesystem read-only EXT4-fs (dm-0): EXT4-fs error (device dm-0): in ext4_da_write_end: IO failure This should not happen!! Data will be lost EXT4-fs (dm-0): ext4_da_writepages: jbd2_start: 1024 pages, in (...)1010855; err -30
對我來說,這看起來像是一個硬體錯誤。你認為RAID可能是原因嗎?安裝了 FUSE 文件系統(實際上不再使用)?問題可能是這個 DELL 伺服器不支持 Ubuntu,那麼使用 Windows 可以解決這個問題嗎?
謝謝
聽起來像是硬體問題。重新啟動和 fsck’ing 不會解決根本問題,使伺服器離線以避免數據失去並執行一些檢查。
檢查 RAID 硬體的啟動實用程序,它們有時具有檢查完整性選項。要非常小心,因為一些低級別的完整性檢查會破壞磁碟上的數據。檢查任何 BIOS 日誌以獲取警告。
問題可能是陣列中的磁碟出現故障(沒有故障轉移備份),請檢查伺服器上是否有不同顏色的指示燈。
根據您的磁碟控制器,您還可以在 linux (ubuntu) 中使用 GSmartControl 獲取磁碟以報告問題所在。