FreeBSD, Gentoo, openSUSE, CentOS, Ubuntu, Debian
a-n
Posts: 145 Joined: 2004-05-10 10:15
Post
by a-n » 2005-07-13 11:59
Hallo,
musste heute wieder festellen das mein Server den Geist aufgeben hatte.
Habe in den Logs massenhaft diese Meldung gefunden.
Code: Select all
Jul 11 03:50:01 Server3 kernel:
Jul 11 03:50:01 Server3 kernel: Code: 89 50 04 89 02 c7 46 04 00 00 00 00 c7 43 1c 00 00 00 00 c7
Jul 11 03:50:01 Server3 kernel: <1>Unable to handle kernel NULL pointer dereference at virtual address 00000004
Jul 11 03:50:01 Server3 kernel: printing eip:
Jul 11 03:50:01 Server3 kernel: c016c3f0
Jul 11 03:50:01 Server3 kernel: *pgd = 0000000000000000
Jul 11 03:50:01 Server3 kernel: *pmd = 0000000000000000
Jul 11 03:50:01 Server3 kernel: Oops: 0002
Jul 11 03:50:01 Server3 kernel: CPU: 0
Jul 11 03:50:01 Server3 kernel: EIP: 0010:[activate_page+48/176] Not tainted
Jul 11 03:50:01 Server3 kernel: EFLAGS: 00010246
Jul 11 03:50:01 Server3 kernel: eax: 00000000 ebx: c197800c ecx: 00000012 edx: 00000000
Jul 11 03:50:01 Server3 kernel: esi: c1978028 edi: 00000094 ebp: f7d6de44 esp: dc70be0c
Jul 11 03:50:01 Server3 kernel: ds: 0018 es: 0018 ss: 0018
Jul 11 03:50:01 Server3 kernel: Process sh (pid: 17439, stackpage=dc70b000)
Jul 11 03:50:01 Server3 kernel: Stack: 00000286 00000000 c197800c 00000012 c01659af c197800c c0166b40 f71b3a34
Jul 11 03:50:01 Server3 kernel: 00000012 f7d6de44 00000094 f71b3980 f71b3a34 f2fc42c0 f5fa50c0 00000000
Jul 11 03:50:01 Server3 kernel: da478168 6805a6c0 c0161ee2 f5fa50c0 6805a000 00000000 da799080 f6004480
Jul 11 03:50:01 Server3 kernel: Call Trace: [mark_page_accessed+31/48] [filemap_nopage+464/528] [do_no_page+130/496] [handle_mm_fault+133/512] [do_page_fault+301/2032]
Jul 11 03:50:01 Server3 kernel: [do_munmap+545/768] [sys_munmap+117/144] [system_call+77/80] [do_page_fault+0/2032] [error_code+52/64]
Wiederholte sich fast jede Sekunde. Der Server war natürlich danach platt.
Weiß jemand was das ist ?
lufthansen
Posts: 390 Joined: 2002-09-24 17:31
Location: NRW
Post
by lufthansen » 2005-07-13 12:10
schuß ins blau: ram def. ?
a-n
Posts: 145 Joined: 2004-05-10 10:15
Post
by a-n » 2005-07-13 12:36
LuftHansen wrote: schuß ins blau: ram def. ?
Das sage ich meinem Anbieter schon zum x-ten male. Aber die sagen immer und immer wieder das der Speicher in Ordnung ist.
Hab auch zwischenzeitlich von 2.6 auf 2.4 Downgegradet, dennoch brachte es keinen erfolg.
Könnte es eventuell auch am Grsecurity Patch liegen ?
captaincrunch
Userprojekt
Posts: 7066 Joined: 2002-10-09 14:30
Location: Dorsten
Post
by captaincrunch » 2005-07-13 13:10
Es handelt sich dabei um einen Oops, der von einem fehlgeschlagen Zugriff auf den virtuellen Speicher hervorgerufen wird. Dieser besteht allerdings nicht ausschließlich aus dem RAM, sondern kann auch auf der Platte liegen (swap).
DebianHowTo
echo "[q]sa[ln0=aln256%Pln256/snlbx]sb729901041524823122snlbxq"|dc
a-n
Posts: 145 Joined: 2004-05-10 10:15
Post
by a-n » 2005-07-13 14:36
Meiner Meinung nach sieht die Festplatte ziemlich ok aus.
Code: Select all
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_ FAILED RAW_VALUE
3 Spin_Up_Time 0x0027 252 252 063 Pre-fail Always - 114
4 Start_Stop_Count 0x0032 253 253 000 Old_age Always - 1
5 Reallocated_Sector_Ct 0x0033 253 253 063 Pre-fail Always - 0
6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail Offline - 0
7 Seek_Error_Rate 0x000a 253 252 000 Old_age Always - 0
8 Seek_Time_Performance 0x0027 249 241 187 Pre-fail Always - 33869
9 Power_On_Minutes 0x0032 242 242 000 Old_age Always - 840h+21m
10 Spin_Retry_Count 0x002b 252 252 157 Pre-fail Always - 0
11 Calibration_Retry_Count 0x002b 252 252 223 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 253 253 000 Old_age Always - 13
192 Power-Off_Retract_Count 0x0032 253 253 000 Old_age Always - 0
193 Load_Cycle_Count 0x0032 253 253 000 Old_age Always - 0
194 Temperature_Celsius 0x0032 253 253 000 Old_age Always - 28
195 Hardware_ECC_Recovered 0x000a 253 252 000 Old_age Always - 2296
196 Reallocated_Event_Count 0x0008 253 253 000 Old_age Offline - 0
197 Current_Pending_Sector 0x0008 253 253 000 Old_age Offline - 0
198 Offline_Uncorrectable 0x0008 253 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0008 199 199 000 Old_age Offline - 0
200 Multi_Zone_Error_Rate 0x000a 253 252 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 253 252 000 Old_age Always - 0
202 TA_Increase_Count 0x000a 253 252 000 Old_age Always - 0
203 Run_Out_Cancel 0x000b 253 252 180 Pre-fail Always - 0
204 Shock_Count_Write_Opern 0x000a 253 252 000 Old_age Always - 0
205 Shock_Rate_Write_Opern 0x000a 253 252 000 Old_age Always - 0
207 Spin_High_Current 0x002a 252 252 000 Old_age Always - 0
208 Spin_Buzz 0x002a 252 252 000 Old_age Always - 0
209 Offline_Seek_Performnce 0x0024 194 194 000 Old_age Offline - 0
99 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
100 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
101 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA _of_first_error
# 1 Extended offline Completed without error 00% 3859 -
# 2 Extended offline Completed without error 00% 3461 -
# 3 Extended offline Completed without error 00% 3375 -
# 4 Short offline Completed without error 00% 3268 -
# 5 Extended offline Completed without error 00% 3263 -
Also kann es nur am Arbeitsspeicher liegen, und ich solle mein Provider nochmal darauf hinweisen ?
Joe User
Project Manager
Posts: 11186 Joined: 2003-02-27 01:00
Location: Hamburg
Post
by Joe User » 2005-07-13 16:01
Kernel putt?
a-n
Posts: 145 Joined: 2004-05-10 10:15
Post
by a-n » 2005-07-13 16:07
Kann ich mir nicht vorstellen, genau das gleiche kam ja auch beim 2.6.12 Kernel.
Und nun versuche ich mein Glück, mit dem 2.4.31, aber anscheinend liegt es nicht am kernel.
andreask2
Posts: 696 Joined: 2004-01-27 14:16
Location: Aachen
Post
by andreask2 » 2005-07-15 08:47
Hast Du mal die Kernel-Config aus dem originalen System versucht?
a-n
Posts: 145 Joined: 2004-05-10 10:15
Post
by a-n » 2005-07-15 09:45
Speicher, wurde ausgetauscht. Seitdem keine Probleme mehr.
Dennoch Thx ;)