Linux

即使 RAM 和 SWAP 足夠空閒,Oracle 也會呼叫 oom-killer?

  • March 11, 2016

你能告訴我這個Oracle程序被殺死的原因嗎?似乎有大量的 RAM 可用,並且有大量的 SWAP 可用。隨後很少有其他 oracle 程序被殺死。VM 有 16G 的 vMem 和 8 個 vCPU。但是我在這裡發布了第一個被殺死的 oracle 程序:

3 月 1 日 20:00:58 ******* 核心:oracle 呼叫了 oom-killer:gfp_mask=0x280da,order=0,oom_adj=0,oom_score_adj=0
3 月 1 日 20:00:58 ******* 核心:oracle cpuset=/mems_allowed=0
3 月 1 日 20:00:58 ******* 核心:Pid:2370,comm:oracle 未污染 2.6.32-431.el6.x86_64 #1
3 月 1 日 20:00:58 ******* 核心:呼叫跟踪:
3月1日20:00:58 *******核心:[]?cpuset_print_task_mems_allowed+0x91/0xb0
3月1日20:00:58 *******核心:[]?轉儲頭+0x90/0x1b0
3月1日20:00:58 *******核心:[]?security_real_capable_noaudit+0x3c/0x70
3月1日20:00:58 *******核心:[]?oom_kill_process+0x82/0x2a0
3月1日20:00:58 *******核心:[]?select_bad_process+0xe1/0x120
3月1日20:00:58 *******核心:[]?out_of_memory+0x220/0x3c0
3月1日20:00:58 *******核心:[]?__alloc_pages_nodemask+0x8ac/0x8d0
3月1日20:00:58 *******核心:[]?alloc_pages_vma+0x9a/0x150
3月1日20:00:58 *******核心:[]?handle_pte_fault+0x73d/0xb00
3月1日20:00:58 *******核心:[]?free_pgtables+0xce/0x120
3月1日20:00:58 *******核心:[]?unmap_region+0xcd/0x130
3月1日20:00:58 *******核心:[]?vma_prio_tree_add+0x75/0xd0
3月1日20:00:58 *******核心:[]?handle_mm_fault+0x22a/0x300
3月1日20:00:58 *******核心:[]?__do_page_fault+0x138/0x480
3月1日20:00:58 *******核心:[]?do_mmap_pgoff+0x335/0x380
3月1日20:00:58 *******核心:[]?do_page_fault+0x3e/0xa0
3月1日20:00:58 *******核心:[]?page_fault+0x25/0x30
3 月 1 日 20:00:58 ******* 核心:記憶體資訊:
3 月 1 日 20:00:58 ******* 核心:節點 0 DMA per-cpu:
3 月 1 日 20:00:58 ******* 核心:CPU 0: hi: 0, btch: 1 usd: 0
3月1日20:00:58 *******核心:CPU 1:hi:0,btch:1 usd:0
3月1日20:00:58 *******核心:CPU 2:hi:0,btch:1 usd:0
3 月 1 日 20:00:58 ******* 核心:CPU 3: hi: 0, btch: 1 usd: 0
3 月 1 日 20:00:58 ******* 核心:CPU 4: hi: 0, btch: 1 usd: 0
3 月 1 日 20:00:58 ******* 核心:CPU 5: hi: 0, btch: 1 usd: 0
3月1日20:00:58 *******核心:CPU 6:hi:0,btch:1 usd:0
3月1日20:00:58 *******核心:CPU 7:hi:0,btch:1 usd:0
3 月 1 日 20:00:58 ******* 核心:節點 0 DMA32 per-cpu:
3月1日20:00:58 *******核心:CPU 0:hi:186,btch:31 usd:0
3月1日20:00:58 *******核心:CPU 1:hi:186,btch:31 usd:0
3 月 1 日 20:00:58 ******* 核心:CPU 2:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:CPU 3:嗨:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:CPU 4:嗨:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:CPU 5:嗨:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:CPU 6:hi:186,btch:31 usd:0
3 月 1 日 20:00:58 ******* 核心:CPU 7:嗨:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:節點 0 每個 CPU 正常:
3月1日20:00:58 *******核心:CPU 0:hi:186,btch:31 usd:0
3月1日20:00:58 *******核心:CPU 1:hi:186,btch:31 usd:0
3 月 1 日 20:00:58 ******* 核心:CPU 2:hi:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:CPU 3:hi:186,btch:31 usd:20
3 月 1 日 20:00:58 ******* 核心:CPU 4:hi:186,btch:31 usd:32
3 月 1 日 20:00:58 ******* 核心:CPU 5:嗨:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:CPU 6:hi:186,btch:31 usd:184
3 月 1 日 20:00:58 ******* 核心:CPU 7:嗨:186,btch:31 美元:0
3 月 1 日 20:00:58 ******* 核心:active_anon:2673615 inactive_anon:368657 isolated_anon:0
3 月 1 日 20:00:58 ******* 核心:active_file:3541 inactive_file:3962 isolated_file:32
3 月 1 日 20:00:58 ******* 核心:unvictable:0 臟:3 寫回:2770 不穩定:0
3 月 1 日 20:00:58 ******* 核心:免費:33763slab_reclaimable:16555slab_unreclaimable:28221
3 月 1 日 20:00:58 ******* 核心:映射:1517627 shmem:1730877 頁表:906135 反彈:0
3 月 1 日 20:00:58 ******* 核心:Node 0 DMA free:15132kB min:60kB low:72kB high:88kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon) :0kB 隔離(文件):0kB 存在:14740kB mlocked:0kB 臟:0kB 回寫:0kB 映射:0kB shmem:0kBslab_reclaimable:0kBslab_unreclaimable:0kB kernel_stack:0kB 頁表:0kB 不穩定:0kB 反彈:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable?是的
3 月 1 日 20:00:58 ******* 核心:lowmem_reserve[]:0 3000 16130 16130
3 月 1 日 20:00:58 ******* 核心:Node 0 DMA32 free:64904kB min:12556kB low:15692kB high:18832kB active_anon:2064816kB inactive_anon:516452kB active_file:492kB inactive_file:188kB unevictable:0kB isolated(anon) :0kB 隔離(文件):0kB 存在:3072096kB mlocked:0kB 臟:0kB 回寫:0kB 映射:2319432kB shmem:2352892kBslab_reclaimable:7420kB slab_unreclaimable:3620kB kernel_stack:832kB 頁表:24672kB 不穩定:0kB 反彈:0kned:1kB pagesscanmp all_unreclaimable?不
3 月 1 日 20:00:58 ******* 核心:lowmem_reserve[]:0 0 13130 13130
3 月 1 日 20:00:58 ******* 核心:節點 0 正常空閒:55016kB 最小值:54964kB 低:68704kB 高:82444kB active_anon:8629644kB inactive_anon:958176kB active_file:13672kB inactive_file:15660kB unevictable:0kB isolated(anon) :0kB isolated(file):128kB present:13445120kB mlocked:0kB dirty:12kB writeback:11080kB mapped:3751076kB shmem:4570616kB slab_reclaimable:58800kB slab_unreclaimable:109264kB kernel_stack:5360kB pagetables:3599868kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:160 all_unreclaimable?不
3 月 1 日 20:00:58 ******* 核心:lowmem_reserve[]: 0 0 0 0
3 月 1 日 20:00:58 ******* 核心:節點 0 DMA:3*4kB 2*8kB 2*16kB 3*32kB 2*64kB 2*128kB 1*256kB 0*512kB 0*1024kB 1*2048kB 3*4096kB = 15132kB
3 月 1 日 20:00:58 ******* 核心:節點 0 DMA32:1225*4kB 859*8kB 878*16kB 547*32kB 184*64kB 34*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 1*4096kB = 65596kB
3 月 1 日 20:00:58 ******* 核心:節點 0 正常:9165*4kB 1804*8kB 46*16kB 2*32kB 1*64kB 1*128kB 1*256kB 1*512kB 1*1024kB 1*2048kB 0*4096kB = 55924kB
3 月 1 日 20:00:58 ******* 核心:1760824 頁記憶體頁總數
3 月 1 日 20:00:58 ******* 核心:交換記憶體中有 22460 個頁面
3 月 1 日 20:00:58 ******* 核心:交換記憶體統計:添加 6636857,刪除 6614397,查找 15635455/16141480
3 月 1 日 20:00:58 ******* 核心:免費交換 = 33548340kB
3 月 1 日 20:00:58 ******* 核心:總交換空間 = 36184056kB
3 月 1 日 20:00:58 ******* 核心:4194288 頁 RAM
3 月 1 日 20:00:58 ******* 核心:保留 111808 頁
3 月 1 日 20:00:58 ******* 核心:共享 59252583 個頁面
3 月 1 日 20:00:58 ******* 核心:2502605 頁非共享
3 月 1 日 20:00:58 ******* 核心:[pid] uid tgid total_vm rss cpu oom_adj oom_score_adj 名稱
3 月 1 日 20:00:58 ******* 核心:[612] 0 612 2769 42 2 -17 -1000 udevd
3 月 1 日 20:00:58 ******* 核心:[1872] 0 1872 47365 204 7 0 0 vmtoolsd
3 月 1 日 20:00:58 ******* 核心:[1980] 0 1980 23294 109 6 -17 -1000 審核
3 月 1 日 20:00:58 ******* 核心:[1996] 0 1996 62898 842 4 0 0 rsyslogd
3 月 1 日 20:00:58 ******* 核心:[2025] 0 2025 2738 93 3 0 0 irqbalance
3 月 1 日 20:00:58 ******* 核心:[2039] 32 2039 4744 68 4 0 0 rpcbind
3 月 1 日 20:00:58 ******* 核心:[2071] 29 2071 5837 61 3 0 0 rpc.statd
3 月 1 日 20:00:58 ******* 核心:[2092] 0 2092 5773 31 1 0 0 rpc.idmapd
3 月 1 日 20:00:58 ******* 核心:[2211] 0 2211 39323 127 5 0 0 pbx_exchange
3 月 1 日 20:00:58 ******* 核心:[2223] 0 2223 48106 158 5 0 0 winbindd
3 月 1 日 20:00:58 ******* 核心:[2237] 0 2237 1020 48 4 0 0 acpid
3 月 1 日 20:00:58 ******* 核心:[2323] 0 2323 49766 281 0 0 0 winbindd
3 月 1 日 20:00:58 ******* 核心:[2540] 0 2540 26827 11 5 0 0 rpc.rquotad
3 月 1 日 20:00:58 ******* 核心:[2544] 0 2544 5414 41 5 0 0 rpc.mountd
3 月 1 日 20:00:58 ******* 核心:[2580] 0 2580 1570 23 0 0 0 mcelog
3 月 1 日 20:00:58 ******* 核心:[2592] 0 2592 16651 78 5 -17 -1000 sshd
3 月 1 日 20:00:58 ******* 核心:[2600] 0 2600 5545 105 3 0 0 xinetd
3 月 1 日 20:00:58 ******* 核心:[2608] 38 2608 7147 132 5 0 0 ntpd
3 月 1 日 20:00:58 ******* 核心:[2618] 498 2618 25741 57 2 0 0 uuidd
3 月 1 日 20:00:58 ******* 核心:[2630] 0 2630 43170 139 3 0 0 vnetd
3 月 1 日 20:00:58 ******* 核心:[2638] 0 2638 52398 158 2 0 0 bpcd
3 月 1 日 20:00:58 ******* 核心:[2655] 0 2655 198335 478 4 0 0 nbdisco
3 月 1 日 20:00:58 ******* 核心:[2676] 0 2676 76958 82 2 0 0 mtstrmd
3 月 1 日 20:00:58 ******* 核心:[2707] 0 2707 22314 141 0 0 0 發送郵件
3 月 1 日 20:00:58 ******* 核心:[2716] 51 2716 19658 80 4 0 0 發送郵件
3 月 1 日 20:00:58 ******* 核心:[2734] 0 2734 200856 353 7 0 0 avagent.bin
3 月 1 日 20:00:58 ******* 核心:[2747] 0 2747 44287 178 3 0 0 調整
3 月 1 日 20:00:58 ******* 核心:[2757] 0 2757 29333 103 6 0 0 crond
3 月 1 日 20:00:58 ******* 核心:[2778] 0 2778 27431 167 7 0 0 saphostexec
3 月 1 日 20:00:58 ******* 核心:[2805] 600 2805 545016 4031 5 0 0 sapstartsrv
3 月 1 日 20:00:58 ******* 核心:[2885] 834 2885 100602 294 3 0 0 sapstartsrv
3 月 1 日 20:00:58 ******* 核心:[2904] 0 2904 5385 31 6 0 0 atd
3 月 1 日 20:00:58 ******* 核心:[2928] 0 2928 26005 69 5 0 0 rhsmcertd
3 月 1 日 20:00:58 ******* 核心:[2935] 0 2935 8154 1110 0 0 0 saposcol
3 月 1 日 20:00:58 ******* 核心:[3098] 834 3098 13538 50 3 0 0 sapstart
3 月 1 日 20:00:58 ******* 核心:[3128] 834 3128 43278 119 5 0 0 jc.sapDAA_SMDA9
3 月 1 日 20:00:58 ******* 核心:[3144] 834 3144 1276839 57796 4 0 0 jstart
3 月 1 日 20:00:58 ******* 核心:[3211] 703 3211 33752 378 5 0 0 perl
3 月 1 日 20:00:58 ******* 核心:[3288] 703 3288 1181563 62355 0 0 0 java
3 月 1 日 20:00:58 ******* 核心:[3497] 0 3497 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 核心:[3499] 0 3499 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 核心:[3502] 0 3502 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 核心:[3504] 0 3504 1016 34 2 0 0 mingetty
3 月 1 日 20:00:58 ******* 核心:[3506] 0 3506 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 核心:[3508] 0 3508 1016 34 1 0 0 mingetty
3 月 1 日 20:00:58 ******* 核心:[3515] 0 3515 3098 41 2 -17 -1000 udevd
3 月 1 日 20:00:58 ******* 核心:[3516] 0 3516 3098 41 4 -17 -1000 udevd
3 月 1 日 20:00:58 ******* 核心:[13764] 0 13764 48089 89 7 0 0 winbindd
3 月 1 日 20:00:58 ******* 核心:[13765] 0 13765 48089 92 7 0 0 winbindd
3 月 1 日 20:00:58 ******* 核心:[13873] 703 13873 2403434 6196 5 0 0 預言機
3 月 1 日 20:00:58 ******* 核心:[13875] 703 13875 2402873 651 3 0 0 預言機
3 月 1 日 20:00:58 ******* 核心:[13880] 703 13880 2402873 423 4 0 0 預言機
3 月 1 日 20:00:58 ******* 核心:[13875] 703 13875 2402873 651 3 0 0 預言機
3 月 1 日 20:00:58 ******* 核心:[13880] 703 13880 2402873 423 4 0 0 預言機

..**注意:這裡刪除了一堆 oracle 程序,以限制此處發布的字元長度。共有 296 個 oracle 程序正在執行。**
..
3 月 1 日 20:00:59 ******* 核心:[18644] 0 18644 44207 371 1 0 0 bpclntcmd
3 月 1 日 20:00:59 ******* 核心:[18647] 703 18647 57442 240 3 0 0 預言機
3 月 1 日 20:00:59 ******* 核心:[18656] 703 18656 57442 185 6 0 0 預言機
3 月 1 日 20:00:59 ******* 核心:[18657] 54329 18657 9279 196 1 0 0 nrpe
3 月 1 日 20:00:59 ******* 核心:[18660] 54329 18660 9314 255 2 0 0 nrpe
3 月 1 日 20:00:59 ******* 核心:[18662] 0 18662 39263 289 5 0 0 crond
3 月 1 日 20:00:59 ******* 核心:[18663] 0 18663 5745 341 1 0 0 saposcol
3 月 1 日 20:00:59 ******* 核心:[18664] 54329 18664 9315 146 3 0 0 nrpe
3 月 1 日 20:00:59 ******* 核心:[18665] 54329 18665 5730 76 0 0 0 check_open_file
3 月 1 日 20:00:59 ******* 核心:[18666] 54329 18666 6611 191 4 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18667] 0 18667 8389 183 1 0 0 sapcimb
3 月 1 日 20:00:59 ******* 核心:[18669] 0 18669 6610 171 0 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18670] 0 18670 6610 171 0 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18677] 0 18677 6610 177 5 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18678] 703 18678 29497 275 4 0 0 perl
3 月 1 日 20:00:59 ******* 核心:[18682] 703 18682 29497 252 7 0 0 perl
3 月 1 日 20:00:59 ******* 核心:[18683] 703 18683 29497 231 0 0 0 perl
3 月 1 日 20:00:59 ******* 核心:[18687] 0 18687 2620 92 1 0 0 .SAPOSCOL_00000
3 月 1 日 20:00:59 ******* 核心:[18688] 0 18688 6610 186 5 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18689] 0 18689 6610 189 2 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18690] 0 18690 6610 191 3 0 0 xinetd
3 月 1 日 20:00:59 ******* 核心:[18691] 0 18691 6610 194 2 0 0 xinetd
3月1日20:00:59 *******核心:記憶體不足:殺死程序13900(oracle)得分77或犧牲孩子
3 月 1 日 20:00:59 ******* 核心:殺死程序 13900,UID 703,(oracle)total-vm:9622308kB,anon-rss:5180kB,file-rss:4028040kB

從上面看,我認為這些行表明我有足夠的 RAM 和交換空間。對?:

節點 0 DMA 免費:15132kB
節點 0 DMA32 免費:64904kB
節點 0 正常免費:55016kB
免費交換 = 33548340kB
總交換 = 36184056kB

想知道 Node 0 DMA 的“all_unreclaimable?yes”和“all_unreclaimable?no”Node 0 DMA31 和 Node 0 Normal 是什麼意思!

此外,以下資訊可能會提供有關伺服器設置的更多資訊:

$sudo sysctl -p
net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
核心.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
錯誤:“net.bridge.bridge-nf-call-ip6tables”是未知鍵
錯誤:“net.bridge.bridge-nf-call-iptables”是未知鍵
錯誤:“net.bridge.bridge-nf-call-arptables”是未知鍵
核心.msgmnb = 65536
核心.msgmax = 65536
kernel.shmmax = 68719476736
核心.msgmni = 1024
kernel.sem = 1250 256000 100 8192
vm.max_map_count = 1000000
kernel.shmall = 1152921504606846720
fs.file-max = 19801952
net.core.rmem_default = 1048576
net.core.wmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_max = 1048576
fs.aio-max-nr = 1048576
net.ipv4.ip_local_port_range = 9000 65500
vm.swappiness = 0
vm.dirty_background_ratio = 3
vm.dirty_ratio = 15
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 100
核心.shmmni = 4096

您根本沒有太多可用記憶體。

首先,vm.swappiness = 0 只有當你確定你有足夠的時候才這樣做。將其設置為 10 左右可能會防止出現記憶體不足的情況。並且實際上會利用您的分頁空間。

從節點 0 的總結來看,你的 16 GB 大概是四分之一頁表,四分之一共享記憶體,一半匿名程序記憶體,還有一些雜七雜八的東西。請注意,現成的文件記憶體,加上空閒,只有幾十 MB,不算大。它無法再為您提供 GB 左右的共享記憶體。

頁表正在吞噬你。您可能沒有啟用大頁面,這是Oracle 推薦的數據庫,Red Hat 也這樣做。

引用自:https://serverfault.com/questions/762149