Server legt sich schlafen

FreeBSD, Gentoo, openSUSE, CentOS, Ubuntu, Debian
Anonymous

Server legt sich schlafen

Post by Anonymous » 2008-10-08 19:47

Moinsen!

Nachdem sich meine Festplatte verabschiedet hat, habe ich einen komplett neuen Server von Strato bekommen.
Leider legt der sich grundsätzlich schlafen, wenn ich ein Backup meiner Datenbank einspiele. Und dann auch ab und zu, wenn ich per FTP Daten hin- und herschaufel.

In den Logs finde ich hinterher folgendes:

Code: Select all

Oct  3 01:06:38 h1806 kernel: hda: dma_timer_expiry: dma status == 0x20
Oct  3 01:06:38 h1806 kernel: hda: DMA timeout retry
Oct  3 01:06:40 h1806 kernel: hda: timeout waiting for DMA
Oct  3 01:06:40 h1806 kernel: hda: status timeout: status=0xd0 { Busy }
Oct  3 01:06:40 h1806 kernel: ide: failed opcode was: unknown
Oct  3 01:06:40 h1806 kernel: hda: drive not ready for command
Oct  3 01:06:40 h1806 kernel: ide0: reset: success
Oct  3 01:06:40 h1806 kernel: Clocksource tsc unstable (delta = 309361134978 ns)
Oct  3 01:06:40 h1806 kernel: Time: acpi_pm clocksource has been installed.


Die letzten beiden Zeilen mit dem Zeit-Gelullere kommen nicht immer. Aber den Rest kann ich durch das Einspielen eines DB-Backups 100%ig reproduzieren.
Dann ist mir noch aufgefallen, dass die Uhrzeiten teilweise gar nicht stimmen. Aber immer nur für ein paar Minuten zwischendurch finde ich Mondzeiten in den Logs.

smartctl hat nix großartiges zu meckern (ich aber, die Platte ist strunzenalt...):

Code: Select all

smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   060    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   097   097   024    Pre-fail  Always       -       169 (Average 169)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       64
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   095   095   000    Old_age   Always       -       38873
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       64
192 Power-Off_Retract_Count 0x0032   099   099   050    Old_age   Always       -       1684
193 Load_Cycle_Count        0x0012   099   099   050    Old_age   Always       -       1684
194 Temperature_Celsius     0x0002   203   203   000    Old_age   Always       -       27 (Lifetime Min/Max 17/42)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0


Laut Strato ist mit meinem Server alles in Ordnung und der Fehler liege bei mir. Ich habe das Teil jetzt gekündigt und mir was anderes geholt, war wohl mal Zeit nach 5 Jahren. :roll:
Von daher müsste ich eigentlich keine Lösung finden. Aber ich will wissen, wo das Problem liegt und was dazulernen. ;)

Es handelt sich um einen frisch mit Suse 10.3 aufgesetzten Stratoserver, wo ich noch nicht dran rumgefummelt hatte.

Gruß...
...Markus