Brauche Hilfe zu einer Kernelfehlermeldung

Apache, Lighttpd, nginx, Cherokee
snake*sl
Posts: 37
Joined: 2004-10-21 18:04
Location: Iserlohn

Brauche Hilfe zu einer Kernelfehlermeldung

Post by snake*sl » 2007-01-12 11:27

Gestern abend gab es scheinbar Probleme mit dem Kernel (?) und der Server wurde von 1und1 automatisch vom Netz genommen.

Ich hab ins Rescue-System gebootet und die Festplatte mit den logfiles gemountet, in messages fand ich folgendes:

Code: Select all

Jan 11 18:51:06 p15134494 kernel: invalid operand: 0000 [#1]
Jan 11 18:51:06 p15134494 kernel: SMP
Jan 11 18:51:06 p15134494 kernel: Modules linked in: sg ide_cd cdrom md5 ipv6
Jan 11 18:51:06 p15134494 kernel: CPU:    0
Jan 11 18:51:06 p15134494 kernel: EIP:    0060:[<c00a4098>]    Not tainted VLI
Jan 11 18:51:06 p15134494 kernel: EFLAGS: 00010006   (2.6.9-041214)
Jan 11 18:51:06 p15134494 kernel: EIP is at 0xc00a4098
Jan 11 18:51:06 p15134494 kernel: eax: ca5e1fc4   ebx: b7dad448   ecx: 0000007b   edx: 00000000
Jan 11 18:51:06 p15134494 kernel: esi: 00000006   edi: c0111998   ebp: 00000000   esp: ca5e1f08
Jan 11 18:51:06 p15134494 kernel: ds: 007b   es: 007b   ss: 0068
Jan 11 18:51:06 p15134494 kernel: Process spamd (pid: 11941, threadinfo=ca5e0000 task=de3f9350)
Jan 11 18:51:06 p15134494 kernel: Stack: c0111a05 b7dad448 00000006 c0111998 bffff7a8 d99de680 c158e800 ca5e1fc4
Jan 11 18:51:06 p15134494 kernel:        c02f3f7e 00000006 0000000e 0000000b c13fae80 c0299b2f df7d2880 d99de280
Jan 11 18:51:06 p15134494 kernel:        d99de280 c888be80 c0299c06 d99de280 00000000 c029f136 d99de280 00000001
Jan 11 18:51:06 p15134494 kernel: Call Trace:
Jan 11 18:51:06 p15134494 kernel:  [do_page_fault+109/1309] do_page_fault+0x6d/0x51d
Jan 11 18:51:06 p15134494 kernel:  [<c0111a05>] do_page_fault+0x6d/0x51d
Jan 11 18:51:06 p15134494 kernel:  [do_page_fault+0/1309] do_page_fault+0x0/0x51d
Jan 11 18:51:06 p15134494 kernel:  [<c0111998>] do_page_fault+0x0/0x51d
Jan 11 18:51:06 p15134494 kernel:  [kfree_skbmem+23/28] kfree_skbmem+0x17/0x1c
Jan 11 18:51:06 p15134494 kernel:  [<c0299b2f>] kfree_skbmem+0x17/0x1c
Jan 11 18:51:06 p15134494 kernel:  [__kfree_skb+210/216] __kfree_skb+0xd2/0xd8
Jan 11 18:51:06 p15134494 kernel:  [<c0299c06>] __kfree_skb+0xd2/0xd8
Jan 11 18:51:06 p15134494 kernel:  [net_tx_action+110/308] net_tx_action+0x6e/0x134
Jan 11 18:51:06 p15134494 kernel:  [<c029f136>] net_tx_action+0x6e/0x134
Jan 11 18:51:06 p15134494 kernel:  [handle_IRQ_event+40/88] handle_IRQ_event+0x28/0x58
Jan 11 18:51:06 p15134494 kernel:  [<c0105fe4>] handle_IRQ_event+0x28/0x58
Jan 11 18:51:06 p15134494 kernel:  [gcc2_compiled.+106/212] __do_softirq+0x6a/0xd4
Jan 11 18:51:06 p15134494 kernel:  [<c011b69a>] __do_softirq+0x6a/0xd4
Jan 11 18:51:06 p15134494 kernel:  [do_IRQ+270/292] do_IRQ+0x10e/0x124
Jan 11 18:51:06 p15134494 kernel:  [<c010637a>] do_IRQ+0x10e/0x124
Jan 11 18:51:06 p15134494 kernel:  [error_code+45/56] error_code+0x2d/0x38
Jan 11 18:51:06 p15134494 kernel:  [<c01046ed>] error_code+0x2d/0x38
Jan 11 18:51:06 p15134494 kernel: Code: ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff f
f ff ff ff <ff> ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff
Jan 11 18:51:06 p15134494 kernel: klogd 1.4.1, ---------- state change ----------
Jan 11 18:51:06 p15134494 kernel: Inspecting /boot/System.map-2.6.9-041214
Jan 11 18:51:06 p15134494 kernel: Loaded 28013 symbols from /boot/System.map-2.6.9-041214.
Jan 11 18:51:06 p15134494 kernel: Symbols match kernel version 2.6.9.
Jan 11 18:51:06 p15134494 kernel: No module symbols loaded - kernel modules not enabled.
Jan 11 18:51:06 p15134494 kernel:  <3>KERNEL: assertion ((int)tcp_packets_in_flight(tp) >= 0) failed at net/ipv4/tcp_input.c (1170)
Jan 11 18:51:06 p15134494 kernel: KERNEL: assertion ((int)tcp_packets_in_flight(tp) >= 0) failed at net/ipv4/tcp_input.c (1170)
Jan 11 18:51:06 p15134494 last message repeated 9 times
Jan 11 18:51:06 p15134494 kernel: eth0: link down
Wie kann ich diese Fehlermeldung deuten?
Hat einer einen heißen Tipp, was zu tun ist?

System: Suse 9.1 mit Confixx; Rescue: Debian Woody 2.6

Vielen Dank schonmal und

Gruß,
snake*sl

User avatar
daemotron
Administrator
Administrator
Posts: 2635
Joined: 2004-01-21 17:44

Re: Brauche Hilfe zu einer Kernelfehlermeldung

Post by daemotron » 2007-01-12 13:19

snake*sl wrote:und der Server wurde von 1und1 automatisch vom Netz genommen
So wie's aussieht, hat sich Dein Server eher selber vom Netz genommen:

Code: Select all

Jan 11 18:51:06 p15134494 kernel:  <3>KERNEL: assertion ((int)tcp_packets_in_flight(tp) >= 0) failed at net/ipv4/tcp_input.c (1170) 
Jan 11 18:51:06 p15134494 kernel: KERNEL: assertion ((int)tcp_packets_in_flight(tp) >= 0) failed at net/ipv4/tcp_input.c (1170) 
Jan 11 18:51:06 p15134494 last message repeated 9 times 
Jan 11 18:51:06 p15134494 kernel: eth0: link down
Für mich sieht das so aus, als sei Deinem SpamAssassin der Speicher ausgegangen, was dann zum Absturz geführt hat:

Code: Select all

Jan 11 18:51:06 p15134494 kernel: Process spamd (pid: 11941, threadinfo=ca5e0000 task=de3f9350)
{...}
Jan 11 18:51:06 p15134494 kernel: Call Trace: 
Jan 11 18:51:06 p15134494 kernel:  [do_page_fault+109/1309] do_page_fault+0x6d/0x51d 
Jan 11 18:51:06 p15134494 kernel:  [<c0111a05>] do_page_fault+0x6d/0x51d 
Jan 11 18:51:06 p15134494 kernel:  [do_page_fault+0/1309] do_page_fault+0x0/0x51d 
Jan 11 18:51:06 p15134494 kernel:  [<c0111998>] do_page_fault+0x0/0x51d
Dazwischen kam dann ein IRQ vom NIC, der dann gleich auch noch mit abgekanzelt wurde, was zum Absturz der Netzwerkverbindung geführt hat:

Code: Select all

Jan 11 18:51:06 p15134494 kernel:  [net_tx_action+110/308] net_tx_action+0x6e/0x134 
Jan 11 18:51:06 p15134494 kernel:  [<c029f136>] net_tx_action+0x6e/0x134 
Jan 11 18:51:06 p15134494 kernel:  [handle_IRQ_event+40/88] handle_IRQ_event+0x28/0x58 
Jan 11 18:51:06 p15134494 kernel:  [<c0105fe4>] handle_IRQ_event+0x28/0x58
Wenn's das wirklich gewesen ist, sollte nach einem Reboot eigentlich wieder alles gut sein.
snake*sl wrote:System: Suse 9.1 mit Confixx
Das wiederum ist weniger gut, denn SuSE 9.1 wird schon seit ca. einem halben Jahr nicht mehr gepflegt, ergo kommt auch Dein System nicht mehr in den Genuss von Bugfixes und Security Patches :roll: