無法訪問私有 GKE 集群中 pod 上的網際網路

July 2, 2021

我目前無法從我的私有 Kubernetes 集群訪問/ping/連接到 Google 之外的任何服務。這些 pod 正在執行 Alpine linux。

路由表

/sleepez/api # ip route show table all
default via 10.52.1.1 dev eth0
10.52.1.0/24 dev eth0 scope link  src 10.52.1.4
broadcast 10.52.1.0 dev eth0 table local scope link  src 10.52.1.4
local 10.52.1.4 dev eth0 table local scope host  src 10.52.1.4
broadcast 10.52.1.255 dev eth0 table local scope link  src 10.52.1.4
broadcast 127.0.0.0 dev lo table local scope link  src 127.0.0.1
local 127.0.0.0/8 dev lo table local scope host  src 127.0.0.1
local 127.0.0.1 dev lo table local scope host  src 127.0.0.1
broadcast 127.255.255.255 dev lo table local scope link  src 127.0.0.1
local ::1 dev lo  metric 0
local fe80::ac29:afff:fea1:9357 dev lo  metric 0
fe80::/64 dev eth0  metric 256
ff00::/8 dev eth0  metric 256
unreachable default dev lo  metric -1  error -101

pod 肯定有一個分配的 IP，並且連接到它的網關沒有問題：

PS C:\...\&gt; kubectl get pods -o wide -n si-dev
NAME                              READY     STATUS    RESTARTS   AGE       IP          NODE
sleep-intel-api-79bf57bd9-c4l8d   1/1       Running   0          52m       10.52.1.4   gke-sez-production-default-pool-74b75ebc-6787

ip addr輸出

1: lo: &lt;LOOPBACK,UP,LOWER_UP&gt; mtu 65536 qdisc noqueue state UNKNOWN qlen 1
   link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
   inet 127.0.0.1/8 scope host lo
      valid_lft forever preferred_lft forever
   inet6 ::1/128 scope host
      valid_lft forever preferred_lft forever
3: eth0@if7: &lt;BROADCAST,MULTICAST,UP,LOWER_UP,M-DOWN&gt; mtu 1460 qdisc noqueue state UP
   link/ether 0a:58:0a:34:01:04 brd ff:ff:ff:ff:ff:ff
   inet 10.52.1.4/24 scope global eth0
      valid_lft forever preferred_lft forever
   inet6 fe80::ac29:afff:fea1:9357/64 scope link
      valid_lft forever preferred_lft forever

Ping 網關工程

/sleepez/api # ping 10.52.1.1
PING 10.52.1.1 (10.52.1.1): 56 data bytes
64 bytes from 10.52.1.1: seq=0 ttl=64 time=0.111 ms
64 bytes from 10.52.1.1: seq=1 ttl=64 time=0.148 ms
64 bytes from 10.52.1.1: seq=2 ttl=64 time=0.137 ms
^C
--- 10.52.1.1 ping statistics ---
3 packets transmitted, 3 packets received, 0% packet loss
round-trip min/avg/max = 0.111/0.132/0.148 ms

Ping 1.1.1.1 失敗

/sleepez/api # ping 1.1.1.1
PING 1.1.1.1 (1.1.1.1): 56 data bytes
^C
--- 1.1.1.1 ping statistics ---
6 packets transmitted, 0 packets received, 100% packet loss

系統服務狀態

PS C:\...\&gt; kubectl get deploy -n kube-system
NAME                    DESIRED   CURRENT   UP-TO-DATE   AVAILABLE   AGE
event-exporter-v0.1.7   1         1         1            1           18m
heapster-v1.4.3         1         1         1            1           18m
kube-dns                2         2         2            2           18m
kube-dns-autoscaler     1         1         1            1           18m
l7-default-backend      1         1         1            1           18m
tiller-deploy           1         1         1            1           14m

Traceroute（Google內部）

/sleepez/api # traceroute -In 74.125.69.105
1  10.52.1.1  0.007 ms  0.006 ms  0.006 ms
2  *  *  *
3  *  *  *
4  *  *

Traceroute（外部）

traceroute to 1.1.1.1 (1.1.1.1), 30 hops max, 46 byte packets
1  10.52.1.1  0.009 ms  0.003 ms  0.004 ms
2  *  *  *
3  *  *  *
[continues...]

私有 GKE 集群中的節點沒有外部 IP 地址，因此它們無法與 Google 以外的站點通信。https://cloud.google.com/kubernetes-engine/docs/how-to/private-clusters#pulling_a_container_image_from_a_registry

我現在有兩個私有 gke 集群正在訪問網際網路。我以為我通過使用 NAT 網關實現了這一點，但現在添加了第三個集群，它不適用於第三個集群。我懷疑這是集群上 kubernetes 版本的差異。
毫無疑問，您的其他私有 ip’d 伺服器/節點可以通過服務訪問您的私有集群，並且您的 pod 可以通過（我認為）NAT 訪問網際網路。

引用自：https://serverfault.com/questions/911144

無法訪問私有 GKE 集群中 pod 上的網際網路

相關問答

超出 GKE 上下文期限：CreateContainerError 並且未能保留容器名稱

損壞的 GKE 後端執行狀況檢查預設值

如何從不同的應用程序觸發 k8s Job？

Google Cloud Run - 如何掛載 FileStore / NFS？

Kubernetes 在 GKE 上管理許多不同的 UDP 伺服器

在創建 Pod 時在 GKE 中獲取“x509：由未知機構簽署的證書”拉取鏡像（私有系統資料庫）