Unix VPS 伺服器幾乎每天都在同一時間停機
我的伺服器負載似乎真的很猛,而且很多時候伺服器在每晚(午夜左右)同時出現故障。我在上面託管了大約 20 個 cPanel 帳戶,並嘗試了我所知道的一切來嘗試找出導致問題的原因。
我嘗試過的一些事情:
- 結合在 /etc/httpd/domlogs 中找到的所有站點訪問日誌,並且在伺服器關閉時看不到任何異常。
- 檢查了 var/log 目錄中的大多數其他日誌,在伺服器關閉時沒有發現任何表明問題的跡象。
- 檢查了 cron 日誌,看不到任何異常。見下文。昨晚 CPU 在 00:14 飆升至 7.5。
我還能檢查什麼?我如何才能真正進行監控以找出根本原因?
12 月 8 日 00:05:01 v1 crond
$$ 6082 $$: (root) CMD (/usr/local/cpanel/bin/dcpumon >/dev/null 2>&1) 12 月 8 日 00:05:01 v1 crond
$$ 6084 $$: (root) CMD (/usr/local/cpanel/whostmgr/bin/dnsqueue > /dev/null 2>&1) 12 月 8 日 00:10:01 v1 crond
$$ 6435 $$: (根) CMD (/usr/lib64/sa/sa1 1 1) 12 月 8 日 00:10:01 v1 crond
$$ 6436 $$: (root) CMD (/usr/local/cpanel/bin/dcpumon >/dev/null 2>&1) 12 月 8 日 00:15:12 v1 crond
$$ 6775 $$: (root) CMD (/usr/local/cpanel/scripts/autorepair recoverymgmt >/dev/null 2>&1) 12 月 8 日 00:15:12 v1 crond
$$ 6776 $$: (root) CMD (/usr/local/cpanel/scripts/recoverymgmt >/dev/null 2>&1) Dec 8 00:15:12 v1 crond$$ 6777 $$: (root) CMD (/usr/local/cpanel/bin/dbindex >/dev/null 2>&1) 12 月 8 日 00:15:12 v1 crond
$$ 6781 $$: (root) CMD (/usr/local/cpanel/bin/dcpumon >/dev/null 2>&1) 12 月 8 日 00:20:33 v1 crond
$$ 7047 $$: (根) CMD (/usr/lib64/sa/sa1 1 1)
雖然這是一個非常廣泛的問題,但這些是您可能會嘗試做的以下事情來找到問題。
- 我確定的第一件事是,這是一個特定的 cron,它每天執行並產生問題。
- 然後首先啟用 sar 日誌記錄,我相信你已經啟用了。如果沒有,請啟用它。
- 使用 sar 日誌查找問題區域,例如檢查磁碟使用率、CPU 使用率和記憶體使用率,並嘗試找出當時執行的任務導致了哪些問題,例如是使用記憶體、磁碟還是 CPU。儘管我認為它應該是記憶體,但您正在獲取我們的記憶體並且您的系統被掛起。
- 一旦你弄清楚了那個主要問題,檢查你在那個時間執行的 crons,它是每天執行的。
- 一旦你有幾個特定的 cron 作業歸零,現在檢查那些可能造成特定問題的作業,看看 cron 作業在做什麼。
希望通過這個,你可以找到問題。