Networking

大型廣播域的潛在影響

  • March 22, 2022

我最近換了工作。到我離開上一份工作時,我們的網路已經建立了三年,並且計劃得很好(在我看來)。我們的地址範圍被拆分成一堆 VLAN,其中最大的子網為 /22 範圍。這是教科書。

我現在工作的公司已經建立了大約 20 年的網路。它非常大,可以到達多個站點,並且具有不拘一格的設備組合。該組織僅將 VLAN 用於非常特定的事情。到目前為止,我只知道 VLAN 的一種用法,那就是也跨越站點邊界的 SAN。

我不是網路工程師,我是支持技術人員。但有時我不得不做一些網路跟踪來調試問題,我對我看到的廣播流量的數量感到震驚。最大的網路是一個直接的 B 類網路,所以它使用 /16 遮罩。當然,如果那裡裝滿了設備,網路可能會停止執行。我認為目前可能有 2000 多個物理和虛擬設備正在使用該子網,但它(大部分)似乎工作。這種做法似乎與我所學的一切背道而馳。

我的問題是:

在您看來, 從我的角度來看 - 哪個指標的什麼測量會告訴我網路上有太多的廣播流量反彈?有哪些跡象表明您可能正在如履薄冰?

在我看來,添加的設備越來越多,這只能意味著更多的廣播流量,所以必須有一個門檻值。事情會變得越來越慢,還是會比這更微妙?

如果配置得當(且安全),大型廣播域本身就沒有任何問題。例如,使用 PVLAN 可以允許非常大的網路而不會產生太多戲劇性,因為孤立的主機看不到來自彼此的流量。類似地,如果網路是相對靜態的,鏈路非常穩定並且控製到位以阻止廣播/多播/單播泛洪,則可以使其工作。

也就是說,通常情況下,您所描述的那種網路(2000 多台主機)基本上是一場等待發生的危機。一些問題/警告標誌可能包括 -

過多的廣播流量 - 應用程序流量隨處可見(即像老式 Windows),過多的 ARP 流量等。從每秒數據包的角度來考慮這一點,而不是絕對頻寬 - 每秒數百個數據包的後台流量正在上升. 請記住,某些網路事件(開關啟動或關閉)可能會嚴重加劇這種情況。

網路直徑/拓撲穩定性 - 在某些條件下(即設備重啟)是否會發生臨時生成樹循環?你看到了多少 TCN 等等?根橋是否在移動?物理上有多少個交換機級聯在一起?

鏈路故障是如何工作的?如果連結失去,會發生什麼?我見過一些情況,當冗餘鏈路出現故障時,網路拓撲結構實際上永遠不會穩定。它需要大規模重啟——好吧,更準確地說,它需要完全重新設計,但這是一個單獨的問題。

路由器和交換機上的介面掉線?緩衝問題?這些也可以是提示。

一般來說,跨越物理站點的橋樑會引起不成比例的麻煩。您的站點(或樓層)不能分成路由子網是否有令人信服的理由?最佳實踐當然是在可能的情況下進行路由並在不可能的地方進行橋接…

引用自:https://serverfault.com/questions/445679