Snmp

Brocade DCX 8510 間 DC 延遲 - 了解 OID 以發現 L1 問題

  • March 19, 2015

試圖確定 FC 鏈路上是否存在一些間歇性的 DC 間延遲,但只能訪問 DCX 8510 的 OID 計數器。由於它是 DWDM 上的 L1 鏈路,因此服務提供商沒有統計數據來衡量任何可能的問題除了連接測試套件之外,由於問題是間歇性的,因此總是乾淨的。

當問題發生時,看到此 OID 的值出現峰值,但試圖找到有關它的正確資訊確實很困難。

swfcportrxbados

任何有關此 OID 的更好解釋的幫助以及一些資訊的指針以更好地理解 SNMP 輸出將不勝感激

背景

swFCPortRxBadOs 跟踪無效有序集的數量,大多數情況下它是針對物理或虛擬介面的錯誤,它也可以應用於背板。

DWDM 或直接 FC(無論是 Cisco 還是 Broccade)的無效有序集通常是主機或節點性能不佳的結果。DWDM 另一側的磁碟提示長度大於 6 左右的 RAID 陣列可能會導致虛擬通道超時。這通常意味著您的虛擬頻道“卡住”了。當一個交換機埠耗盡所有可用信用時,連接到設備的交換機埠需要保留額外的出站幀,直到設備返回信用以進入緩衝區。當設備在超時內沒有響應時,傳輸開關將保持幀的時間更長,從而導致高緩衝區佔用。這會導致交換機降低將緩衝區信用返回給其他傳輸交換機的速率。

所以…..接下來的步驟

可能的罪魁禍首

  1. Physical Layer Badness - 在另一側或您正在查看的交換機上正在或正在變壞的 SFP。
  2. 虛擬通道“卡住” - 上面的解釋。如果虛擬通道被卡住,那麼它不會傳遞流量或信號,您會看到 er_bad_os 計數器增加。

Brocade 建議在 FOS 中啟用bottleneckmon。當有兩秒鐘的視窗沒有任何流量時,它將重置 VC(虛擬通道)。

bottleneckmon –cfgcredittools -intport -recover onLrOnly

當一個或多個信用失去時,它將開始尋找它的視窗來重置 VC。

這是關於 Fabric Resiliency Best Practices 的精彩 PDF http://www.brocade.com/downloads/documents/html_product_manuals/NOS_MIB_301/wwhelp/wwhimpl/common/html/wwhelp.htm#context=NOS_MIB_v301_HTML&file=5_sw-mib.06.4.html

使用 portstatushow 作為你的埠,看看你是否得到一個 er_bad_os 591691 Invalid ordered set

它可以讓您確信您遇到的是無效的有序集,因此您可以開始排除這些類型問題經常出現的信用和緩衝區問題。

關於緩沖積分的好文章。 http://community.brocade.com/t5/Mainframe-Solutions/Buffer-Credits-and-Frame-Size-calculation-in-FOS-7-1/ba-p/455

引用自:https://serverfault.com/questions/662031