Centos

如何最好地監控/記錄 eth0 上的問題?

  • July 19, 2015

我已經手動配置了一個電子郵件伺服器 - 非常簡單的配置,我沒有做任何花哨的網路。我只是通過 iptables 只打開了相關的埠。

然而,每 10-15 天一次,eth0 就會消失,所有網路都停止。預設日誌沒有告訴我發生了什麼。當它發生時,我唯一要做的修復它(並且我似乎可以修復它的唯一方法)是通過 KVM 訪問重新啟動伺服器。

問題是,我可以安裝哪些監控/記錄工具來查看問題所在?在向託管公司大喊硬體問題之前,我會盡力而為。

我正在執行 CentOS 6 伺服器。

只是為了以後參考,我終於發現了問題所在。

這實際上是由於 CentOS 核心未按預期設置時間同步 tx 控制寄存器。

參考資料: https ://groups.google.com/forum/#!topic/springdale-users/ bBqrE545sYo http://bugs.centos.org/view.php?id=6810

最後,在我升級到新伺服器後,這個問題就自行解決了。

如果它不在核心中的 /var/log/messages 或 dmesg 中,那麼我不確定哪個實用程序會為您提供資訊以找出答案。我會嘗試在 /etc/rsyslog.conf 中將日誌記錄設置為調試,查找帶有 /var/log/messages 的行並將資訊更改為調試。

根據我的經驗,在 CentOS 中消失的 eth0 與 NetworkManager 有關。確保禁用網路管理器,然後啟用網路。/etc/sysconfig/network-scripts/ifcfg-eth0當我通過創建/修改手動配置網路但忘記了chkconfig networkmanager off時,我已經看到了這種情況chkconfig network on

最好的辦法可能是下次發生時通過 KVM 進行實時故障排除。我可能會嘗試的另一件事是一個循環,該循環執行類似於ethtool每 30-60 秒獲取連結狀態的內容,只是為了獲取故障發生的時間範圍。當您需要關注時間戳或非常小的時間範圍時,閱讀日誌會容易得多。:)

最後,如果確實發生了某些事情,/etc/sysconfig/network-scripts/ifcfg-eth0那麼您可以創建和審核策略以監視該文件的任何更改。

引用自:https://serverfault.com/questions/597951