Vmware-Esxi

在 VMWare 上丟棄大數據包

  • October 31, 2019

我們的網路中有一個奇怪的問題,根據 networkengineering.stackexchange 在那裡是題外話,儘管在我看來這是一個網路問題。

當我們想將 SQL 數據庫恢復到測試數據庫時,我們第一次看到它。還原失敗,在 windows 日誌中我們看到 iSCSI 錯誤,掛載的 iSCSI 磁碟似乎經常失去連接(使用 veeam 還原備份 - 這會將備份文件掛載為 iSCSI 卷(目標是物理備份伺服器,啟動器是虛擬 SQL伺服器))。

我們做了一些測試,這不僅僅是 iSCSI 問題,當我們在物理伺服器和虛擬伺服器之間複製文件時會發生這種情況。我們的監控顯示在復製過程中出現了很高的錯誤,奇怪的是我們在交換機上沒有看到錯誤。

當我們複製大文件時,我們在虛擬伺服器的交換機埠(交換機是 Netgear M5300)上看到的是“接收的數據包 > 1518 個八位字節”和“發送的數據包 > 1518 個八位字節”。但是大於 1518 的“數據包 RX 和 TX”為 0。這僅發生在 ESX 的埠上,在任何測試中都不會發生在其他伺服器的埠上。

所有埠(交換機、vSwitch、埠組、伺服器介面)都將 MTU 設置為預設值 (1518 / 1500)。我們重新啟動了備份伺服器和所有包含 VM 的 esx,禁用並重新啟用了交換機埠。發送伺服器上的 Wireshark 顯示大數據包(64kb),但根據交換機統計,此埠僅接收正常的 1518 幀。

即使我們將文件上傳到 esx 數據儲存,它似乎只發生在這個測試 esx 上,我們擁有的所有虛擬機。

我不知道在哪裡搜尋了。我們唯一還沒有重啟的是交換機本身,因為這是網路中的核心組件,我們不能在生產期間這樣做(生產是 24/7)。我們將在周末嘗試這個,但如果有人有提示在哪裡看,我將不勝感激。

編輯:為了完整起見,一個小的拓撲: 在此處輸入圖像描述

EDIT2:進行了更多測試:錯誤僅在具有多個 vlan 的上行鏈路埠上可見。如果我只使用一個未標記的 vlan,那麼任何地方都沒有錯誤,也沒有超過 1518 的數據包。

如果我現在考慮一下,帶有 VLAN 標記的數據包的大小為 1522。但有些交換機不關心這一點,有些則關心——MTU 到處都是預設值。我不想停止在 vmware 中使用標記的 VLAN……知道嗎?

顯然,關於“數據包 > 1518”的資訊沒有此連結到 Netgear 論壇。VLAN標記的 4 個字節自動添加到 MTU 設置中,因此無需將其更改為 1522 或其他內容。

如果他們在計算大於 1518 的數據包時不計算標記數據包,那會更好……

這意味著我們的備份恢復問題有另一個來源……搜尋仍在繼續……

引用自:https://serverfault.com/questions/988339