Iscsi

在 Equallogic 掛起 45 分鐘後,防止在 Xenserver 上執行的 ext3 Linux Vms 損壞

  • August 22, 2016

今天我的 Storage Equallogic PS4000E 遇到問題,它們卡住了 45 分鐘,然後正常啟動並執行,沒有日誌,沒有任何東西可以幫助我們發現發生了什麼。

好吧,我執行帶有 2 個伺服器池版本的 Xenserver。5.6 SP2,在儲存出現這個問題後,最近的 Linux vms Ubuntu 12 和 Windows Vms 恢復正常工作,但大多數舊的 Debian Vms,變成只讀 FS,我們需要全部 fsck,一些 vms 被永久損壞等重新啟動和 fsck 後正常工作。

我想知道是否有任何方法可以防止 iScsi 上的 VM 文件系統損壞失去連接/超時連接,可能會增加 Xen 上的 iScsi 超時或每個來賓 VM 中的類似情況。

有人嗎?

當您處理大約 1 小時的儲存連接失去時,損壞不會完全可以預防 - 當然不是通過調整虛擬機管理程序或作業系統中的某些 SCSI 超時變數。

不幸的是,您無法更新保修,但對於 7.2k 磁碟 Equallogic 系統來說是正常的,最長保修期為 5 年(10K/15K/SSD 單元可以延長至 7 年)。我會連結到 EQL“發布和支持指南”PDF,但訪問託管它的支持頁面需要有效的保修。

您說只有您的“舊”Debian VM 之後會遇到嚴重的問題——這可能與他們使用的文件系統和/或您的掛載配置方式有關?(例如data=journal/ ordered/ writeback

沒有日誌,沒有任何東西可以幫助我們發現發生了什麼

這是極不可能的,儘管如果沒有以前的經驗/熟悉收集和分析它們,可能很難獲得許多日誌數據集。

你怎麼知道這是一個儲存問題?您觀察到哪些事件/錯誤或行為導致了這一結論?

@Dom 在關於切換日誌的評論中提出了一個很好的問題。Equallogic 診斷不是圍繞最終使用者的可讀性建構的,但如果日誌記錄確實到位,則切換日誌應該是完全可訪問和可讀的。

如果您沒有預算在 SAN 使用壽命/可支持性結束後更換它,那麼您一開始就買不起。我知道這完全是事後諸葛亮,對你沒有幫助,但你應該認真考慮從 EQL 儲存轉移到更便宜的東西(比如多台伺服器、僅本地儲存,以及使用 DRBD 之類的複制 VM)。SAN 可能很棒,但它也是一項嚴肅的財務承諾。

引用自:https://serverfault.com/questions/798022