Networking

我的 Cisco 交換機埠壞了嗎?

  • June 6, 2015

在過去的幾天裡,我一直在為內部網路上的少數最終使用者尋找封包遺失和網路穩定性問題……這些問題上週浮出水面,但該位置在六週前**被閃電擊中。**

在 77 米跑的另一邊,我看到四台 Cisco 2960 和幾台 PC 和電話之間的封包遺失率為 5-10%。PC 通過中繼鏈路(交換機埠配置 pastebin )與電話內聯執行。我們看到客戶端-伺服器應用程序和 Microsoft Exchange 連接出現掉線和中斷。

我遠端嘗試了通常的故障排除步驟,讓本地技術人員在使用者和生產活動中斷期間執行以下操作:

  • 更換牆壁插孔和設備之間的電纜。
  • 更換配線架和交換機埠之間的跳線。
  • 嘗試 2960 堆棧中的不同交換機埠。
  • 使用已知良好的設備(新手機、不同的 PC)更換最終使用者設備。
  • 清除交換機埠介面計數器並密切監視遞增錯誤。(Pastebin 的輸出sh int
  • 仔細研究設備日誌和Observium RRD 圖。交換機端沒有鏈路上/下問題。
  • 更換最終使用者側的電源板。
  • test cable-diagnostics tdr int Gi4/0/9使用(乾淨)*從 Cisco 2960 執行測試電纜
  • 使用 Tripp-Lite 電纜測試儀測試電纜。(乾淨的)
  • 在交換機堆疊成員上執行診斷。(乾淨的)

最後換了三下交換機埠,終於找到了穩定的解決方案。唯一合乎邏輯的結論是,一些 Cisco 2960 交換機埠是壞的或不穩定的……沒有死,但行為也不一致。我不習慣看到單個埠以這種方式死亡。

我還可以測試或檢查什麼來確定這些設備是否有問題?

驗證這一點的最佳實踐方法是什麼?

單個埠出現問題而不是連續的埠庫是否常見?


順便說一句 -show cable-diagnostics tdr int Gi4/0/14非常酷……

Interface Speed Local pair Pair length        Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14  1000M Pair A     79   +/- 0  meters Pair B      Normal              
               Pair B     75   +/- 0  meters Pair A      Normal              
               Pair C     77   +/- 0  meters Pair D      Normal              
               Pair D     79   +/- 0  meters Pair C      Normal              

雖然埠組通常共享一個 ASIC,但每個埠都必須有自己獨立的 PHY。如果 PHY 已損壞,則它可能會出現問題,而其鄰居則不會。

也就是說,輸出下降是物理問題的一個奇怪症狀——並非不可能,但並不典型。儘管有半雙工鏈路,但輸出下降通常與緩衝區耗盡有關,而不是物理問題。

您可以通過線上路的另一端設置數據包擷取來獲取更多資訊。預計不良 PHY 會在鏈路的一側或兩側出現一定數量的物理層錯誤(不良 CRC、runt/giant 等)。

總而言之,聽起來你已經消除了足夠多的東西,以至於它可能已經超過了收益遞減點。如果您有契約,我會推薦 RMA。

引用自:https://serverfault.com/questions/425793