Monitoring

Google Stackdriver 顯示所有 kubernetes pod 的使用統計資訊,除了一個

  • March 1, 2018

我在 GCP 上部署了一個 Kubernetes 集群,並使用 Stackdriver 來監控 CPU 和記憶體。Stackdriver 會列出集群中所有 Pod 的統計資訊(CPU、記憶體等),但其中一個除外。這已經持續了一周,並且失去的 pod 肯定正在執行。奇怪的是,我看不到堆棧驅動程序界面中的統計資訊,但 GCP 的部署概述中有 CPU 和記憶體統計資訊。

附加資訊:

  • 集群有4個節點
  • 失去的 pod 正在 ubuntu 上執行 postgres
  • 所有其他 pod 都在執行 debian

有任何想法嗎?

我通過在 Ubuntu 容器上啟動一個帶有 Postgres 的 pod 來重現您的案例,並且可以在 Stackdriver 中查看該 pod 的統計資訊。

您是否確保容器正常執行並且不會在 pod 內永久重啟?

我遇到了這種情況,因為 Postgres 容器正在停止,因為容器沒有處理任何動作來維持它的存活。

如果是這種情況,您應該查看容器的入口點,並確保它啟動一個長時間執行的命令,除非它會在啟動 Postgres 後立即終止。

我希望這有幫助

引用自:https://serverfault.com/questions/899274