Kernel Fehler - Swapd - Absturz

FreeBSD, Gentoo, openSUSE, CentOS, Ubuntu, Debian
klerfrq
Posts: 38
Joined: 2004-08-04 19:54
 

Kernel Fehler - Swapd - Absturz

Post by klerfrq »

Hallo zusammen,

ein Server mit RH9 hat sich eine Nacht verabschiedet, die Konsole hat sich nicht mehr gerührt - lediglich der Power Button hat nur noch geholfen.

Die letzte Nachricht, die der Server hintelassen hat war folgende:

Code: Select all

Jul  3 02:06:01 pete kernel: Unable to handle kernel paging request at virtual address 6e702e7c
Jul  3 02:06:01 pete kernel:  printing eip:
Jul  3 02:06:01 pete kernel: c014f34d
Jul  3 02:06:01 pete kernel: *pde = 00000000
Jul  3 02:06:01 pete kernel: Oops: 0002
Jul  3 02:06:01 pete kernel: iptable_filter ide-tape sr_mod st sg esm lp parport autofs bcm5700 iptable_mangle iptable_nat ip_conntrack ip_tables ide-cd cdrom loop keybdev mousedev hid in
Jul  3 02:06:01 pete kernel: CPU:    0
Jul  3 02:06:01 pete kernel: EIP:    0060:[<c014f34d>]    Tainted: P
Jul  3 02:06:01 pete kernel: EFLAGS: 00010246
Jul  3 02:06:01 pete kernel:
Jul  3 02:06:01 pete kernel: EIP is at try_to_unmap_one [kernel] 0xdd (2.4.20-9smp)
Jul  3 02:06:01 pete kernel: eax: 00000000   ebx: d68da163   ecx: fffec000   edx: 000d68da
Jul  3 02:06:01 pete kernel: esi: fffec500   edi: 6e702e4c   ebp: 00140067   esp: c25abee0
Jul  3 02:06:01 pete kernel: ds: 0068   es: 0068   ss: 0068
Jul  3 02:06:01 pete kernel: Process kswapd (pid: 11, stackpage=c25ab000)
Jul  3 02:06:01 pete kernel: Stack: c232b06c c013be37 00299a00 c1012f60 c1012f60 00299a00 c1012f60 c1012f7c
Jul  3 02:06:01 pete kernel:        ffffffff c1012f60 c014f5a7 c1012f60 00000000 c0422120 00299a00 c1012f60
Jul  3 02:06:01 pete kernel:        c1012f7c c033e900 000001d0 c0146114 c1012f60 c0340dc8 df6cc280 00000001
Jul  3 02:06:01 pete kernel: Call Trace:   [<c013be37>] add_to_page_cache_unique [kernel] 0x67 (0xc25abee4))
Jul  3 02:06:01 pete kernel: [<c014f5a7>] try_to_unmap [kernel] 0x117 (0xc25abf08))
Jul  3 02:06:01 pete kernel: [<c0146114>] launder_page [kernel] 0x7d4 (0xc25abf2c))
Jul  3 02:06:01 pete kernel: [<c01470bc>] rebalance_dirty_zone [kernel] 0x9c (0xc25abf50))
Jul  3 02:06:01 pete kernel: [<c01471e4>] rebalance_inactive_zone [kernel] 0xa4 (0xc25abf70))
Jul  3 02:06:01 pete kernel: [<c0147278>] rebalance_inactive [kernel] 0x48 (0xc25abf90))
Jul  3 02:06:01 pete kernel: [<c01473b1>] do_try_to_free_pages_kswapd [kernel] 0x51 (0xc25abfb4))
Jul  3 02:06:01 pete kernel: [<c0147643>] kswapd [kernel] 0x83 (0xc25abfd4))
Jul  3 02:06:01 pete kernel: [<c01475c0>] kswapd [kernel] 0x0 (0xc25abfe4))
Jul  3 02:06:01 pete kernel: [<c010759d>] kernel_thread_helper [kernel] 0x5 (0xc25abff0))
Jul  3 02:06:01 pete kernel:
Jul  3 02:06:01 pete kernel:
Jul  3 02:06:01 pete kernel: Code: 86 47 30 84 c0 ba 01 00 00 00 7f 0a 83 c4 18 89 d0 5b 5e 5f
Jul  3 10:54:14 pete syslogd 1.4.1: restart.
Jul  3 10:54:14 pete syslog: Starten von syslogd succeeded
Jul  3 10:54:14 pete kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jul  3 10:54:14 pete kernel: Linux version 2.4.20-9smp (bhcompile@stripples.devel.redhat.com) (gcc version 3.2.2 20030313 (Red Hat Linux 3.2.2-10)) #1 SMP Wed Apr 2 13:28:49 EST 2003 
Die Meldung heisst laut Internetrecherche soviel, dass ein Fehler beim Adressieren von Speicher aufgetreten ist. Der Server hat versucht in den Swap zu schreiben, wobei ein Fehler aufgetreten ist und sich dann das System aufgehangen hat.


Jetzt stellt sich für mich aber die Frage, was kann das gewesen sein, weil zu der Zeit kein Job wie Backup oder ähnliches lief. Nach einem Reboot läuft nun der Server wieder einwandfrei.

Grüße
- klerfrq -
sogo
Posts: 27
Joined: 2007-04-11 11:17
Location: London, UK
 

Re: Kernel Fehler - Swapd - Absturz

Post by sogo »

klerfrq wrote:Hallo zusammen,

ein Server mit RH9 hat sich eine Nacht verabschiedet, die Konsole hat sich nicht mehr gerührt - lediglich der Power Button hat nur noch geholfen.

Die letzte Nachricht, die der Server hintelassen hat war folgende:
[...]
Kann ein Kernelfehler oder ein Hardwarefehler sein.
Ersteres Problem kannst Du durch ein Upgrade auf eine neuere Distribution (Fedora zum Beispiel) loesen, da RHL9 seit langem nicht mehr geupdated wird (auch nicht durch fedoralegacy.org).
Zweiteres: memtest 24h laufen lassen...

-- sogos