Networking
Mac mini 與 1GbE 斷開連接:RFI / EMI?
我們的伺服器機房中有幾台 2012 年的 Mac mini,當相鄰的伺服器處於繁重的 CPU 負載下時,它們可以可靠地斷開與 1GbE 網路的連接(但其他方面似乎仍在工作)。
我們懷疑 RFI / EMI,但不能 100% 確定,因為我們還沒有很好的方法來測量它並隔離源。同一個房間裡的其他伺服器(超過 50 台,包括一堆 xserve 在內的各種伺服器)都很好。從伺服器機房拿出來,Mac Mini 很好。
奇怪的部分:
- 在我們將三台新伺服器(渲染節點)添加到現有的三台伺服器後,斷開連接開始發生,幾乎將它們確定為問題的根源
- 這些伺服器空閒時沒有問題
- 當所有六個都低於 50% 或更高的 CPU 負載時,問題似乎開始了
- 伺服器機房中的所有其他設備——很多,各種——都沒有問題;只有 Mac mini 受到影響
您會推薦什麼來解決和解決問題?(除了關閉那些新的渲染節點——我們確實需要而且似乎不會影響其他任何東西。)
我們嘗試過的:
- 放入已知良好的 2012 Mac mini 並觀察相同的問題(我們沒有 2012 以外的 Mac mini)
- 在伺服器機房周圍移動 Mac mini;房間內的位置似乎無關緊要
- 從渲染節點和其他設備收集 CPU 使用率數據;Mac mini 和其他使用 Solarwinds NPM 的網路設備的響應時間和超時;觀察渲染節點上的 CPU 負載峰值與 Mac mini 上的網路問題之間的強相關性
PS我們還沒有做的:
- 要檢查它是否只是一台伺服器行為不端的可能性,請一次斷開一台伺服器,同時將其餘伺服器置於 100% CPU 負載之下
- 研究 RFI/EMI 測量和隔離設備和服務
- 嘗試將 Mac mini 接地(它們的電源線是 2 芯的,未接地)或以其他方式屏蔽它們免受 RFI / EMI
我們確實需要 Mac mini,因為我們的 Xserve 用完了,而且某些應用程序只能在 Mac 上執行。
PPS 道歉,如果這是題外話和/或在錯誤的論壇。
感謝您的任何想法!
罪魁禍首是 HP G8 伺服器上的特定附加 4 埠 NIC,當處於網路負載下時,會導致 Mac Mini 斷開連接。一旦我們虛擬化了伺服器,將 HP 重新用於其他不需要高網路使用率的事情 - 問題就消失了。換句話說,這不是 EMI/RFI,而是與 Mac Mini 對網路上非常具體的事件敏感有關。我們在網路上有很多其他節點,包括多種風格的 Mac Pro、XServes、iMac、MBP、多種風格的伺服器和各種設備——沒有一個有問題,只有 Mac Mini。
另一部分是這個問題只會發生在同一個房間(數據中心)的 Mac Mini 上——所以也許這些 Mac Mini 連接到那個房間的網路(電纜、交換機)的方式也起了作用。