Linux
Asterisk 使用 100% 的 cpu 並凍結我的 debian 主機
我有一個 Debian 主機
$ unname -a
Linux voip 2.6.25-2-amd64 #1 SMP Mon Jul 14 11:05:23 UTC 2008 x86_64 GNU/Linux
舊星號
星號 1:1.4.21.2~dfsg-3
它已經工作了很長時間
$正常執行時間
13:50:37 增加 1047 天,21:02,7 個使用者,平均負載:0.17、0.19、2.81
今天主機被凍結,ping 被回答,但我無法 ssh,沒有 dhcp 或任何其他服務。
從控制台登錄並查看頂部後,我看到星號正在使用 100% 的 cpu。killall 星號不起作用,我不得不求助於 killall -9。重新啟動服務後,一切似乎都很好。
我檢查了我的日誌並註意到了這一點:
> Mar 12 13:18:06 voip kernel: [96834831.947297] asterisk D > ffff81000100a080 0 15757 1 Mar 12 13:18:06 > voip kernel: [96834831.947304] ffff8100390fdda8 0000000000000086 > ffff810039561c00 ffff810024af33d8 > Mar 12 13:18:06 voip kernel: [96834831.947310] ffff81002dda8080 > ffff810039cb2d40 ffff81002dda82f0 0000000000000001 > Mar 12 13:18:06 voip kernel: [96834831.947317] 0000000000000296 > 0000000000000003 ffff8100390fdda8 ffffffff8022bea4 > Mar 12 13:18:06 voip kernel: [96834831.947322] Call Trace: > Mar 12 13:18:06 voip kernel: [96834831.947345] [<ffffffff8022bea4>] > __wake_up+0x38/0x4e Mar 12 13:18:06 voip kernel: [96834831.947364] [<ffffffff881145b4>] > :jbd:log_wait_commit+0x9f/0xed Mar 12 13:18:06 voip > kernel: [96834831.947373] [<ffffffff80246a54>] > autoremove_wake_function+0x0/0x2e Mar 12 13:18:06 voip > kernel: [96834831.947389] [<ffffffff881104f7>] > :jbd:journal_stop+0x165/0x18d Mar 12 13:18:06 voip > kernel: [96834831.947400] [<ffffffff802b4c6d>] > __writeback_single_inode+0x17f/0x29d Mar 12 13:18:06 voip kernel: [96834831.947407] [<ffffffff80246a54>] > autoremove_wake_function+0x0/0x2e Mar 12 13:18:06 voip > kernel: [96834831.947419] [<ffffffff802b558b>] sync_inode+0x24/0x31 > Mar 12 13:18:06 voip kernel: [96834831.947440] [<ffffffff881213ce>] > :ext3:ext3_sync_file+0x8a/0x9c Mar 12 13:18:06 voip > kernel: [96834831.947449] [<ffffffff802b79c2>] do_fsync+0x52/0xa4 > Mar 12 13:18:06 voip kernel: [96834831.947456] [<ffffffff802b7a37>] > __do_fsync+0x23/0x36 Mar 12 13:18:06 voip kernel: [96834831.947463] [<ffffffff8020bd9a>] > system_call_after_swapgs+0x8a/0x8f
我很困惑,這是一個星號錯誤嗎?或者是其他東西?為什麼我在日誌中看到 do_fsync 和 sync_inode?可能是文件系統或硬碟問題?(我用的是lvm+ext3)
誰能指出我正確的方向?
如果某件事已經連續三年順利執行並且突然開始拋出與文件系統相關的核心錯誤,我會說你的硬體開始融化了。立即確保您有可用的備份並立即用新的伺服器替換伺服器。
或者,至少更換硬碟驅動器,即使看起來像 HD 問題的問題有時可能是由於 RAM/CPU 損壞或過熱造成的。
我想你可能有硬體問題。嘗試執行
fsck
以修復您的文件系統。