單台機器的 SLES11 隨機不可達性
我遇到了一個非常奇怪的問題,我現在很迷茫。自從我的公司嘗試切換到 SUSE 以來,我已經設置了幾台 Suse SLES 11 SP2 機器。每台裝有 SLES 11 的機器都有這個特定的問題:
安裝後,一切正常。但是,如果通過 SSH 從 Debian 機器(Squeeze 和 Wheezy)或 Putty(最新版本)連接,連接偶爾會斷開,並且只能從該機器無法訪問機器。如果我然後通過某個隨機伺服器連接到它,它可以工作,而我什至無法從我的機器上 ping 那台機器。
更多細節:
- 機器上的 tcpdump 看到我自己的 ping 嘗試,但沒有發送回复
- SSH 只是在發生這種情況時超時
- 重新啟動網路介面或重新啟動可暫時解決問題
- 隨機發生在 1 分鐘到幾個小時之間
- 所有機器都在同一個子網上
- 所有機器都連接到 cisco 交換機,此子網上未配置 VLAN
- 檢查 IP 盜竊(可能是筆記型電腦隨機睡眠和醒來做事),沒有成功
- 為了完成混亂,來自 RedHat6 機器(完全相同的硬體)的連接永遠不會遇到這個問題
- e1000e 模組正在所有這些機器上使用(當然除了帶有 putty 的 windows),在一側或兩側更新到最新韌體沒有幫助
- 網路電纜也已切換 - 沒有成功
- eeprom_fix_82574_or_82583 沒有解決此問題,即使其中一些機器上存在該問題
- 在這些有問題的機器上安裝 Debian 可以解決問題,但出於公司原因不需要…
所以我在這裡,完全一無所知……有沒有人知道這裡出了什麼問題?
感謝阿貝,我找到了解決這個問題的方法:
簡單地。禁用。iptables。
完全,也就是說,通過在啟動時禁用核心模組載入以及在 Yast 中預先禁用防火牆。
創建此文件並重新啟動,然後使用 lsmod 檢查 iptables 是否仍然載入:
納米 /etc/modprobe.d/netfilter.conf
alias ip_tables off alias iptable off alias iptable_nat off alias iptable_filter off alias x_tables off alias nf_nat off alias nf_conntrack_ipv4 off alias nf_conntrack off
之後,路由問題自行解決,中間的不必要路由點已被移除,因此它現在只是一個躍點,而不是從一開始就兩個躍點。
機器上的 tcpdump 看到我自己的 ping 嘗試,但沒有發送回复
在 GNU/Linux 中,
tcpdump
可以看到被本地iptables
防火牆阻止的數據包,所以如果您沒有看到任何回復正在發送,這可能是由於入站ICMP
被阻止,或者缺少ARP
源條目。為了診斷這些問題,
-e
switch oftcpdump
很有幫助,因為它會列印對外連結路層地址,並且在分析流量時確保也擷取ARP
流量。要排除
ARP
(簡單)的可能性,您可以添加靜態/永久ARP
條目以查看問題是否消失。如果在添加靜態 ARP 條目後,它就會消失,那麼可能有人在竊取 ARP 或者正在進行一些 ARP 過濾。