kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969! (сервер зависает намертво)

Взгляд изнутри

Модератор: Модераторы разделов

Ответить
Аватара пользователя
Denisiuk
Сообщения: 114
ОС: Ubuntu

kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение Denisiuk »

Здравствуйте, сервер периодически зависает наглухо. Долго ловил причину, вот сегодня случилось такое:

Код: Выделить всё

Aug 29 20:18:32 titan kernel: [195471.085689] ------------[ cut here ]------------
Aug 29 20:18:32 titan kernel: [195471.085703] kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!
Aug 29 20:18:32 titan kernel: [195471.085711] invalid opcode: 0000 [#1] SMP
Aug 29 20:18:32 titan kernel: [195471.085719] last sysfs file: /sys/devices/system/cpu/cpu1/cpufreq/scaling_governor
Aug 29 20:18:32 titan kernel: [195471.085728] Modules linked in: ppdev fbcon tileblit font bitblit softcursor vga16fb vgastate snd_hda_codec_via snd_hda_intel snd_hda_codec bttv v4l2_common nouveau ttm ir_common videobuf_dma_sg videobuf_core drm_kms_helper usblp snd_usb_audio asus_atk0110 snd_pcm snd_timer uvcvideo videodev btcx_risc tveeprom v4l1_compat snd_usb_lib snd_rawmidi snd_seq_device snd_hwdep psmouse serio_raw shpchp lp drm i2c_algo_bit intel_agp agpgart snd soundcore snd_page_alloc parport floppy r8169 mii pata_jmicron
Aug 29 20:18:32 titan kernel: [195471.085836]
Aug 29 20:18:32 titan kernel: [195471.085842] Pid: 1189, comm: snmpd Not tainted (2.6.32-30-generic-pae #59-Ubuntu) System Product Name
Aug 29 20:18:32 titan kernel: [195471.085851] EIP: 0060:[<c0208825>] EFLAGS: 00210246 CPU: 0
Aug 29 20:18:32 titan kernel: [195471.085861] EIP is at kfree+0xf5/0x100
Aug 29 20:18:32 titan kernel: [195471.085866] EAX: 4002002c EBX: c1673ec0 ECX: 00000000 EDX: 00000000
Aug 29 20:18:32 titan kernel: [195471.085873] ESI: ed076000 EDI: f75e2e40 EBP: f1ca9f10 ESP: f1ca9ef8
Aug 29 20:18:32 titan kernel: [195471.085880]  DS: 007b ES: 007b FS: 00d8 GS: 00e0 SS: 0068
Aug 29 20:18:32 titan kernel: [195471.085887] Process snmpd (pid: 1189, ti=f1ca8000 task=f56dd940 task.ti=f1ca8000)
Aug 29 20:18:32 titan kernel: [195471.085894] Stack:
Aug 29 20:18:32 titan kernel: [195471.085897]  f1451a80 f7114f18 f75e2e40 ed076000 00000000 f75e2e40 f1ca9f20 c022e1a6
Aug 29 20:18:32 titan kernel: [195471.085915] <0> f4e83100 f7114f18 f1ca9f44 c0258173 f2f6e780 c022e180 f2f6e780 f75e2e88
Aug 29 20:18:32 titan kernel: [195471.085936] <0> f2f6e780 00000010 f7008ee0 f1ca9f74 c02151df 00000003 00000000 00000000
Aug 29 20:18:32 titan kernel: [195471.085956] Call Trace:
Aug 29 20:18:32 titan kernel: [195471.085963]  [<c022e1a6>] ? single_release+0x26/0x40
Aug 29 20:18:32 titan kernel: [195471.085971]  [<c0258173>] ? proc_reg_release+0xb3/0x130
Aug 29 20:18:32 titan kernel: [195471.085979]  [<c022e180>] ? single_release+0x0/0x40
Aug 29 20:18:32 titan kernel: [195471.085986]  [<c02151df>] ? __fput+0xdf/0x1f0
Aug 29 20:18:32 titan kernel: [195471.085992]  [<c021530d>] ? fput+0x1d/0x30
Aug 29 20:18:32 titan kernel: [195471.085999]  [<c021182c>] ? filp_close+0x4c/0x80
Aug 29 20:18:32 titan kernel: [195471.086006]  [<c02118d5>] ? sys_close+0x75/0xc0
Aug 29 20:18:32 titan kernel: [195471.086013]  [<c01096c3>] ? sysenter_do_call+0x12/0x28
Aug 29 20:18:32 titan kernel: [195471.086019] Code: 8b 03 e9 78 ff ff ff 8b 3d 30 ec 7d c0 85 ff 0f 84 48 ff ff ff 8b 0f 83 c7 04 89 f2 89 d8 ff d1 8b 0f 85 c9 75 f1 e9 32 ff ff ff <0f> 0b eb fe 8d b4 26 00 00 00 00 55 89 e5 0f 1f 44 00 00 83 e8
Aug 29 20:18:32 titan kernel: [195471.086115] EIP: [<c0208825>] kfree+0xf5/0x100 SS:ESP 0068:f1ca9ef8
Aug 29 20:18:32 titan kernel: [195471.087290] BUG: unable to handle kernel
Aug 29 20:18:32 titan kernel: [195471.087293] BUG: unable to handle kernel paging request at 5b6b17dc
Aug 29 20:18:32 titan kernel: [195471.087295] IP: [<c0209497>] __kmalloc+0x77/0x190
Aug 29 20:18:32 titan kernel: [195471.087299] *pdpt = 0000000034f44001 *pde = 0000000000000000
Aug 29 20:18:32 titan kernel: [195471.087302] Oops: 0000 [#2] SMP
Aug 29 20:18:32 titan kernel: [195471.087304] last sysfs file: /sys/devices/system/cpu/cpu1/cpufreq/scaling_governor
Aug 29 20:18:32 titan kernel: [195471.087305] Modules linked in: ppdev fbcon tileblit font bitblit softcursor vga16fb vgastate snd_hda_codec_via snd_hda_intel snd_hda_codec bttv v4l2_common nouveau ttm ir_common videobuf_dma_sg videobuf_core drm_kms_helper usblp snd_usb_audio asus_atk0110 snd_pcm snd_timer uvcvideo videodev btcx_risc tveeprom v4l1_compat snd_usb_lib snd_rawmidi snd_seq_device snd_hwdep psmouse serio_raw shpchp lp drm i2c_algo_bit intel_agp agpgart snd soundcore snd_page_alloc parport floppy r8169 mii pata_jmicron
Aug 29 20:18:32 titan kernel: [195471.087328]
Aug 29 20:18:32 titan kernel: [195471.087330] Pid: 1189, comm: snmpd Not tainted (2.6.32-30-generic-pae #59-Ubuntu) System Product Name
Aug 29 20:18:32 titan kernel: [195471.087333] EIP: 0060:[<c0209497>] EFLAGS: 00210002 CPU: 0
Aug 29 20:18:32 titan kernel: [195471.087335] EIP is at __kmalloc+0x77/0x190
Aug 29 20:18:32 titan kernel: [195471.087337] EAX: c220617c EBX: c07a2550 ECX: 5b6b17dc EDX: 00000000
Aug 29 20:18:32 titan kernel: [195471.087339] ESI: 00000020 EDI: 00000020 EBP: f1ca9898 ESP: f1ca9870
Aug 29 20:18:32 titan kernel: [195471.087341]  DS: 007b ES: 007b FS: 00d8 GS: 00e0 SS: 0068
Aug 29 20:18:32 titan kernel: [195471.087343] Process snmpd (pid: 1189, ti=f1ca8000 task=f56dd940 task.ti=f1ca8000)
Aug 29 20:18:32 titan kernel: [195471.087344] Stack:
Aug 29 20:18:32 titan kernel: [195471.087345]  f4e343b0 f7437000 efca3bb8 00000010 00200046 5b6b17dc 00000010 f7428000
Aug 29 20:18:32 titan kernel: [195471.087349] <0> f24f9800 00000000 f1ca9930 f93d6ba2 ffff00ff c04eb3c9 f1ca98f8 00000002
Aug 29 20:18:32 titan kernel: [195471.087353] <0> f74373a0 f6c6e210 00000002 00000000 f1ca98f1 00209914 f5724400 00000720
Aug 29 20:18:32 titan kernel: [195471.087357] Call Trace:
Aug 29 20:18:32 titan kernel: [195471.087361]  [<f93d6ba2>] ? bit_cursor+0x282/0x5bc [bitblit]
Aug 29 20:18:32 titan kernel: [195471.087366]  [<c04eb3c9>] ? dev_hard_start_xmit+0x129/0x240
Aug 29 20:18:32 titan kernel: [195471.087370]  [<c035cbe6>] ? put_dec+0x136/0x140
Aug 29 20:18:32 titan kernel: [195471.087373]  [<c035cef7>] ? number+0x307/0x320
Aug 29 20:18:32 titan kernel: [195471.087378]  [<fc834f09>] ? fbcon_cursor+0x1a9/0x310 [fbcon]
Aug 29 20:18:32 titan kernel: [195471.087381]  [<f93d6920>] ? bit_cursor+0x0/0x5bc [bitblit]
Aug 29 20:18:32 titan kernel: [195471.087385]  [<c03d98a8>] ? hide_cursor+0x28/0x90
Aug 29 20:18:32 titan kernel: [195471.087388]  [<c03dbbcc>] ? vt_console_print+0x29c/0x2d0
Aug 29 20:18:32 titan kernel: [195471.087390]  [<c035eaf8>] ? vsnprintf+0xc8/0x410
Aug 29 20:18:32 titan kernel: [195471.087393]  [<c03db930>] ? vt_console_print+0x0/0x2d0
Aug 29 20:18:32 titan kernel: [195471.087397]  [<c0154da4>] ? __call_console_drivers+0x64/0x80
Aug 29 20:18:32 titan kernel: [195471.087400]  [<c0154e0e>] ? _call_console_drivers+0x4e/0x90
Aug 29 20:18:32 titan kernel: [195471.087403]  [<c0155123>] ? release_console_sem+0xa3/0x200
Aug 29 20:18:32 titan kernel: [195471.087406]  [<c01556cc>] ? vprintk+0x18c/0x3f0
Aug 29 20:18:32 titan kernel: [195471.087420]  [<f881ad3f>] ? nv50_fbcon_imageblit+0x2df/0x340 [nouveau]
Aug 29 20:18:32 titan kernel: [195471.087425]  [<c05b3015>] ? printk+0x1d/0x20
Aug 29 20:18:32 titan kernel: [195471.087428]  [<c0131fd1>] ? show_fault_oops+0x41/0xe0
Aug 29 20:18:32 titan kernel: [195471.087431]  [<c05b673a>] ? oops_begin+0x7a/0x90
Aug 29 20:18:32 titan kernel: [195471.087434]  [<c0131ded>] ? is_prefetch+0x2d/0x180
Aug 29 20:18:32 titan kernel: [195471.087437]  [<c01320d2>] ? no_context+0x62/0xe0
Aug 29 20:18:32 titan kernel: [195471.087443]  [<f86a96f2>] ? T.828+0x12/0x20 [drm_kms_helper]
Aug 29 20:18:32 titan kernel: [195471.087446]  [<c013218c>] ? __bad_area_nosemaphore+0x3c/0x160
Aug 29 20:18:32 titan kernel: [195471.087450]  [<f86a9dda>] ? drm_crtc_helper_set_config+0x6da/0x870 [drm_kms_helper]
Aug 29 20:18:32 titan kernel: [195471.087454]  [<c0132310>] ? bad_area+0x40/0x50
Aug 29 20:18:32 titan kernel: [195471.087457]  [<c05b7ec2>] ? do_page_fault+0x332/0x3a0
Aug 29 20:18:32 titan kernel: [195471.087460]  [<c05b7b90>] ? do_page_fault+0x0/0x3a0
Aug 29 20:18:32 titan kernel: [195471.087463]  [<c05b5b53>] ? error_code+0x73/0x80
Aug 29 20:18:32 titan kernel: [195471.087465]  [<c0209497>] ? __kmalloc+0x77/0x190
Aug 29 20:18:32 titan kernel: [195471.087469]  [<f93d6ba2>] ? bit_cursor+0x282/0x5bc [bitblit]
Aug 29 20:18:32 titan kernel: [195471.087473]  [<fc83466e>] ? fbcon_putcs+0x18e/0x2b0 [fbcon]
Aug 29 20:18:32 titan kernel: [195471.087476]  [<f93d63c0>] ? bit_putcs+0x0/0x560 [bitblit]
Aug 29 20:18:32 titan kernel: [195471.087479]  [<fc834f09>] ? fbcon_cursor+0x1a9/0x310 [fbcon]
Aug 29 20:18:32 titan kernel: [195471.087482]  [<f93d6920>] ? bit_cursor+0x0/0x5bc [bitblit]
Aug 29 20:18:32 titan kernel: [195471.087485]  [<c03d9970>] ? set_cursor+0x60/0x80
Aug 29 20:18:32 titan kernel: [195471.087488]  [<c03dc2d5>] ? redraw_screen+0x185/0x1c0
Aug 29 20:18:32 titan kernel: [195471.087492]  [<fc835f1c>] ? fbcon_blank+0x17c/0x260 [fbcon]
Aug 29 20:18:32 titan kernel: [195471.087495]  [<c03db930>] ? vt_console_print+0x0/0x2d0
Aug 29 20:18:32 titan kernel: [195471.087498]  [<c05b577f>] ? _spin_lock_irqsave+0x2f/0x50
Aug 29 20:18:32 titan kernel: [195471.087501]  [<c015523a>] ? release_console_sem+0x1ba/0x200
Aug 29 20:18:32 titan kernel: [195471.087505]  [<c0130ee8>] ? default_spin_lock_flags+0x8/0x10
Aug 29 20:18:32 titan kernel: [195471.087507]  [<c05b577f>] ? _spin_lock_irqsave+0x2f/0x50
Aug 29 20:18:32 titan kernel: [195471.087512]  [<c0163e2c>] ? lock_timer_base+0x2c/0x60
Aug 29 20:18:32 titan kernel: [195471.087515]  [<c0164cd2>] ? mod_timer+0x102/0x1e0
Aug 29 20:18:32 titan kernel: [195471.087518]  [<c03dcb5a>] ? do_unblank_screen+0x9a/0x160
Aug 29 20:18:32 titan kernel: [195471.087521]  [<c03dcc2f>] ? unblank_screen+0xf/0x20
Aug 29 20:18:32 titan kernel: [195471.087524]  [<c0360b85>] ? bust_spinlocks+0x15/0x40
Aug 29 20:18:32 titan kernel: [195471.087526]  [<c05b6624>] ? oops_end+0x34/0xd0
Aug 29 20:18:32 titan kernel: [195471.087529]  [<c010cd64>] ? die+0x54/0x80
Aug 29 20:18:32 titan kernel: [195471.087532]  [<c05b5dd6>] ? do_trap+0x96/0xc0
Aug 29 20:18:32 titan kernel: [195471.087534]  [<c010ae40>] ? do_invalid_op+0x0/0xa0
Aug 29 20:18:32 titan kernel: [195471.087537]  [<c010aecb>] ? do_invalid_op+0x8b/0xa0
Aug 29 20:18:32 titan kernel: [195471.087540]  [<c0208825>] ? kfree+0xf5/0x100
Aug 29 20:18:32 titan kernel: [195471.087543]  [<c05b5b53>] ? error_code+0x73/0x80
Aug 29 20:18:32 titan kernel: [195471.087547]  [<c03500d8>] ? __bsg_write+0xf8/0x1f0
Aug 29 20:18:32 titan kernel: [195471.087549]  [<c0208825>] ? kfree+0xf5/0x100
Aug 29 20:18:32 titan kernel: [195471.087553]  [<c022e1a6>] ? single_release+0x26/0x40
Aug 29 20:18:32 titan kernel: [195471.087555]  [<c0258173>] ? proc_reg_release+0xb3/0x130
Aug 29 20:18:32 titan kernel: [195471.087558]  [<c022e180>] ? single_release+0x0/0x40
Aug 29 20:18:32 titan kernel: [195471.087561]  [<c02151df>] ? __fput+0xdf/0x1f0
Aug 29 20:18:32 titan kernel: [195471.087563]  [<c021530d>] ? fput+0x1d/0x30
Aug 29 20:18:32 titan kernel: [195471.087566]  [<c021182c>] ? filp_close+0x4c/0x80
Aug 29 20:18:32 titan kernel: [195471.087569]  [<c02118d5>] ? sys_close+0x75/0xc0
Aug 29 20:18:32 titan kernel: [195471.087572]  [<c01096c3>] ? sysenter_do_call+0x12/0x28
Aug 29 20:18:32 titan kernel: [195471.087573] Code: 89 45 e8 fa 90 8d 74 26 00 64 a1 20 97 88 c0 8b 84 83 84 00 00 00 8b 50 10 89 55 e4 8b 10 85 d2 89 55 ec 74 54 8b 4d ec 8b 50 0c <8b> 14 91 89 10 8b 45 e8 50 9d 8d 74 26 00 8b 55 ec 85 d2 0f 85
Aug 29 20:18:32 titan kernel: [195471.087593] EIP: [<c0209497>] __kmalloc+0x77/0x190 SS:ESP 0068:f1ca9870
Aug 29 20:18:32 titan kernel: [195471.087597] CR2: 000000005b6b17dc
Aug 29 20:18:32 titan kernel: [195471.087599] ---[ end trace c842b3491257073f ]---
Aug 29 20:31:44 titan kernel: imklog 4.2.0, log source = /proc/kmsg started.



Кто-нибудь в курсе что произошло-то? и как это исправить?

Как я понял, проблема в snmpd. Я его сейчас удалю, но это не решение :( сейчас я snmp не использую, но в планах разработка приложения с использованием snmp.

Если не в ту ветку попал, то переведите куда следует.

Спасибо.
Спасибо сказали:
Аватара пользователя
taaroa
Сообщения: 1319

Re: kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение taaroa »

Denisiuk писал(а):
29.08.2011 21:43
Кто-нибудь в курсе что произошло-то? и как это исправить?

https://encrypted.google.com/search?hl=ru&...amp;newwindow=1
как исправить? обновить ядро или открыть баг в багзилле вашего дистрибутива.
:wq
Спасибо сказали:
Аватара пользователя
Denisiuk
Сообщения: 114
ОС: Ubuntu

Re: kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение Denisiuk »

спасибо. к сожалению, ничего не смог почерпнуть полезного из гугла :(
дистриб убунту сервер Ubuntu 10.04.3
никогда не постил баги в трекер убунты, считая, что я не первый с проблемой сталкиваюсь. это мне путь на лаунчпад?
Спасибо сказали:
Аватара пользователя
vr13
Сообщения: 876
ОС: gentoo

Re: kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение vr13 »

ошибка означает буквально следующее: в ядре производится попытка освободить память - kfree(), которую никто ранее не запрашивал вызовом kmalloc(). иными словами, нарушение структуры памяти ядра. к пользовательским процессам и snmpd в частности, прямого отношения точно не имеет

судя по некоторым признакам в стеке - произошло во время какой-то операции ввода-вывода. система, кстати, вешается не от этой ошибки (при ее возникновении ядро деградирует от memory leak, но может продолжать работу), а от чего-то другого, что в лог попасть не успевает

единственно верный совет вам уже дали: обновлять ядро и надеяться на лучшее. так как разбираться с памятью в ядре - задача весьма не тривиальная, даже ошибку засабмитить грамотно, нужно быть семи пядей во лбу :)
Спасибо сказали:
firefish
Сообщения: 1

Re: kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение firefish »

Попробуйте перенаправить консоль на последовательный порт, возможно удасться поймать что именно вешает систему.
Спасибо сказали:
Аватара пользователя
Denisiuk
Сообщения: 114
ОС: Ubuntu

Re: kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение Denisiuk »

firefish писал(а):
16.09.2011 02:58
Попробуйте перенаправить консоль на последовательный порт, возможно удасться поймать что именно вешает систему.

боюсь, я даже не догадываюсь, как это делается :(
кстати, вот 2 недели работал как часы. вчера перезагрузил, ядро обновилось.
Спасибо сказали:
Аватара пользователя
sash-kan
Администратор
Сообщения: 13939
Статус: oel ngati kameie
ОС: GNU
Контактная информация:

Re: kernel BUG at /build/buildd/linux-2.6.32/mm/slub.c:2969!

Сообщение sash-kan »

Denisiuk писал(а):
16.09.2011 03:11
боюсь, я даже не догадываюсь, как это делается
см.:
$ less -p 'console=' /path/to/linux/sources/Documentation/kernel-parameters.txt
Писать безграмотно - значит посягать на время людей, к которым мы адресуемся, а потому совершенно недопустимо в правильно организованном обществе. © Щерба Л. В., 1957
при сбоях форума см.блог
Спасибо сказали:
Ответить