僅一個 IP（在同一子網中）的 Ubuntu 20.04 路由以“dev lo”而不是“dev eth0”結尾，kubernetes 工作節點無法連接到主節點

September 2, 2021

我碰到了（現在在我看來）路由問題。我無法再從我的主節點（伺服器）訪問我的一個工作節點（伺服器）。AFAIK，它與 Kubernetes 無關，它會導致純 Linux 網路問題。由於問題只有一個 IP，我正在對 iptables 進行故障排除，啟用 TRACE 並意識到數據包實際上來自 master（eth0），到達 iptables（通過：raw > mangle > nat）但是當它必須從 nat 路由到過濾，它就消失了。據我了解，這是核心必須做出路由決策的關鍵。檢查路由，發現它不適用於一個 IP（來自同一 IP 段的所有其他 IP 都工作正常）！？由於我與雲提供商合作，無法對網路進行故障排除，因此我嘗試重新安裝主節點（伺服器）的作業系統（相同的 Ubuntu 20.04）。
root@vmi57XXXX:~# route  
Kernel IP routing table  
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface  
default         gw.provider.net 0.0.0.0         UG    0      0        0 eth0  
10.244.0.0      0.0.0.0         255.255.255.0   U     0      0        0 cni0  
10.244.1.0      10.244.1.0      255.255.255.0   UG    0      0        0 flannel.1  
172.17.0.0      0.0.0.0         255.255.0.0     U     0      0        0 docker0  
root@vmi57XXXX:~# ip route get xx.xx.xx.96  
local xx.xx.xx.96 dev lo src xx.xx.xx.96 uid 0   
   cache &lt;local&gt;   
root@vmi57XXXX:~# ip route get xx.xx.xx.95  
xx.xx.xx.95 via xx.xx.xx.1 dev eth0 src xx.xx.xx.95 uid 0   
   cache  
root@vmi57XXXX:~# ip route get xx.xx.xx.97  
xx.xx.xx.97 via xx.xx.xx.1 dev eth0 src xx.xx.xx.97 uid 0   
   cache   
 
root@vmi57XXXX:~# arp -v  
Address                  HWtype  HWaddress           Flags Mask            Iface  
10.244.0.60              ether   8a:94:de:43:b6:0f   C                     cni0  
10.244.0.63              ether   1e:76:6a:60:27:f3   C                     cni0  
10.244.0.62              ether   36:0b:19:5e:57:87   C                     cni0  
gw.provider.net          ether   00:c0:1d:c0:ff:ee   C                     eth0  
10.244.0.64              ether   82:03:61:c5:4d:fb   C                     cni0  
10.244.0.50                      (incomplete)                              cni0  
10.244.1.0               ether   52:3d:a5:f4:c2:2c   CM                    flannel.1  
10.244.0.61              ether   56:19:98:79:a1:3a   C                     cni0  
Entries: 8  Skipped: 0  Found: 8  

root@vmi57XXXX:~# ip netconf show dev eth0
inet eth0 forwarding on rp_filter off mc_forwarding off proxy_neigh off 
ignore_routes_with_linkdown off 
inet6 eth0 forwarding off mc_forwarding off proxy_neigh off 
ignore_routes_with_linkdown off 
任何關於那裡發生的事情的線索都非常受歡迎！！！
謝謝
編輯：解決問題後，值得一提的是，Kubernetes 1.21.2-00 和 flannel 作為 CNI 都經歷過這種行為。幾週前我進行了升級，這是升級後第一次重啟一個工作節點。

解決了！
壞人實際上是 Kubernetes——它在主節點上設置了一個本地路由，如果沒有 Kubernetes 的功能網路服務（法蘭絨——在我的例子中），它就無法工作。因此，當工作節點重新啟動時，它不再能夠訪問主節點的 API 服務 (6443/tcp) 並且無法將自己呈現給 API——在這個封閉的魔法圈中，woker 節點沒有運氣循環。
我今天了解了核心維護的“本地”路由（所有現有的路由表都可以在這裡找到：/etc/iproute2/rt_tables）。
ip route ls table local
local xx.xx.xx.96 dev kube-ipvs0 proto kernel scope host src xx.xx.xx.96  &lt;&lt;&lt; PROBLEMATIC
local xx.xx.xx.50 dev eth0 proto kernel scope host src xx.xx.xx.50  &lt;&lt;&lt; i.e. OK
刪除路線
ip route del table local local xx.xx.xx.96 dev kube-ipvs0 proto kernel scope host src xx.xx.xx.96
現在它可以工作了
root@vmi57XXXX:~# ip route get xx.xx.xx.96
xx.xx.xx.96 via xx.xx.xx.1 dev eth0 src xx.xx.xx.50 uid 0 
   cache

引用自：https://serverfault.com/questions/1076400

僅一個 IP（在同一子網中）的 Ubuntu 20.04 路由以“dev lo”而不是“dev eth0”結尾，kubernetes 工作節點無法連接到主節點

相關問答

在 Kubernetes 的裸機上管理多個 LAN

重新啟動時 Netplan 路由失敗

microk8s適合生產環境，還是只適合開發？

OpenVPN - 如何停止通過 VPN 伺服器的公共流量路由？

Ubuntu：netplan 禁用 dhcp

Kubernetes：如何強制 kube-proxy 僅在 localhost 上偵聽