Centos5

伺服器意外崩潰

  • March 7, 2016

我完全不知道伺服器是如何崩潰的,我發現的唯一異常是來自 munin 的以下圖表:

在此處輸入圖像描述

請不要告訴我我需要更多 RAM,正如您所見,在事件發生之前,一切都是穩定的。我只是不明白為什麼伺服器突然崩潰,也不明白為什麼記憶體需求突然如此之高。

首先檢查 dmesg 和系統日誌是否有任何核心面板或記憶體使用情況。看起來您有一個正在使用所有記憶體的應用程序。試試這個腳本,它將你的程序列表記錄在一個文件中,你就會知道是什麼導致了你的問題:

#!/bin/bash
mkdir /tmp/mem_log
while [ 1 ] ; do
  date "+%Y-%m-%d %H:%M:%S"
  ps aux
  sleep 60
done

並像這樣執行它:

nohup ./mem_log.sh > /tmp/mem_log/mem_log.log &

在下一次伺服器崩潰後,檢查日誌以查看哪個程序使用了所有記憶體。這是一個記憶體問題,但不是因為你沒有足夠的記憶體,它只是一個錯誤的過程導致了這個。

引用自:https://serverfault.com/questions/175564