Linux

Asterisk 使用 100% 的 cpu 並凍結我的 debian 主機

  • March 13, 2012

我有一個 Debian 主機

$ unname -a

Linux voip 2.6.25-2-amd64 #1 SMP Mon Jul 14 11:05:23 UTC 2008 x86_64 GNU/Linux

舊星號

星號 1:1.4.21.2~dfsg-3

它已經工作了很長時間

$正常執行時間

13:50:37 增加 1047 天,21:02,7 個使用者,平均負載:0.17、0.19、2.81

今天主機被凍結,ping 被回答,但我無法 ssh,沒有 dhcp 或任何其他服務。

從控制台登錄並查看頂部後,我看到星號正在使用 100% 的 cpu。killall 星號不起作用,我不得不求助於 killall -9。重新啟動服務後,一切似乎都很好。

我檢查了我的日誌並註意到了這一點:

> Mar 12 13:18:06 voip kernel: [96834831.947297] asterisk      D
> ffff81000100a080     0 15757      1                 Mar 12 13:18:06
> voip kernel: [96834831.947304]  ffff8100390fdda8 0000000000000086
> ffff810039561c00 ffff810024af33d8                                     
> Mar 12 13:18:06 voip kernel: [96834831.947310]  ffff81002dda8080
> ffff810039cb2d40 ffff81002dda82f0 0000000000000001                    
> Mar 12 13:18:06 voip kernel: [96834831.947317]  0000000000000296
> 0000000000000003 ffff8100390fdda8 ffffffff8022bea4                    
> Mar 12 13:18:06 voip kernel: [96834831.947322] Call Trace:            
> Mar 12 13:18:06 voip kernel: [96834831.947345]  [<ffffffff8022bea4>]
> __wake_up+0x38/0x4e                           Mar 12 13:18:06 voip kernel: [96834831.947364]  [<ffffffff881145b4>]
> :jbd:log_wait_commit+0x9f/0xed                Mar 12 13:18:06 voip
> kernel: [96834831.947373]  [<ffffffff80246a54>]
> autoremove_wake_function+0x0/0x2e             Mar 12 13:18:06 voip
> kernel: [96834831.947389]  [<ffffffff881104f7>]
> :jbd:journal_stop+0x165/0x18d                 Mar 12 13:18:06 voip
> kernel: [96834831.947400]  [<ffffffff802b4c6d>]
> __writeback_single_inode+0x17f/0x29d          Mar 12 13:18:06 voip kernel: [96834831.947407]  [<ffffffff80246a54>]
> autoremove_wake_function+0x0/0x2e             Mar 12 13:18:06 voip
> kernel: [96834831.947419]  [<ffffffff802b558b>] sync_inode+0x24/0x31  
> Mar 12 13:18:06 voip kernel: [96834831.947440]  [<ffffffff881213ce>]
> :ext3:ext3_sync_file+0x8a/0x9c                Mar 12 13:18:06 voip
> kernel: [96834831.947449]  [<ffffffff802b79c2>] do_fsync+0x52/0xa4    
> Mar 12 13:18:06 voip kernel: [96834831.947456]  [<ffffffff802b7a37>]
> __do_fsync+0x23/0x36                          Mar 12 13:18:06 voip kernel: [96834831.947463]  [<ffffffff8020bd9a>]
> system_call_after_swapgs+0x8a/0x8f

我很困惑,這是一個星號錯誤嗎?或者是其他東西?為什麼我在日誌中看到 do_fsync 和 sync_inode?可能是文件系統或硬碟問題?(我用的是lvm+ext3)

誰能指出我正確的方向?

如果某件事已經連續三年順利執行並且突然開始拋出與文件系統相關的核心錯誤,我會說你的硬體開始融化了。立即確保您有可用的備份並立即用新的伺服器替換伺服器。

或者,至少更換硬碟驅​​動器,即使看起來像 HD 問題的問題有時可能是由於 RAM/CPU 損壞或過熱造成的。

我想你可能有硬體問題。嘗試執行fsck以修復您的文件系統。

引用自:https://serverfault.com/questions/368720