Hardwareproblem bei Strato

FreeBSD, Gentoo, openSUSE, CentOS, Ubuntu, Debian
braindead
RSAC
Posts: 257
Joined: 2002-10-22 09:49
Location: vorm Rechner

Hardwareproblem bei Strato

Post by braindead » 2005-07-04 16:53

Hi,

ich habe eine Rootserver bei Strato der sich leider im Abstand von 2-3 Woche immer mal wieder aufhängt. Das sieht dann so aus, das der Rechner noch zu pingen ist und der cron noch läuft (sieht man an /var/log/messages), das wars dann aber auch schon. Weder der Apache noch SSH oder MySql sind zu erreichen. In /var/log/messages steht dann folgedens:
    Jul 3 09:46:46 h129009 kernel: hda: dma_timer_expiry: dma status == 0x21 Jul 3 09:46:56 h129009 kernel: hda: DMA timeout error Jul 3 09:46:56 h129009 kernel: hda: dma timeout error: status=0xd0 { Busy } Jul 3 09:46:56 h129009 kernel: Jul 3 09:46:56 h129009 kernel: ide: failed opcode was: unknown Jul 3 09:46:56 h129009 kernel: hda: DMA disabled Jul 3 09:46:56 h129009 kernel: ide0: reset: success Jul 3 09:59:01 h129009 /usr/sbin/cron[17262]: (root) CMD ( rm -f /var/spool/cron/lastrun/cron.hourly) Jul 3 10:20:42 h129009 -- MARK -- Jul 3 10:40:42 h129009 -- MARK -- Jul 3 10:59:01 h129009 /usr/sbin/cron[17489]: (root) CMD ( rm -f /var/spool/cron/lastrun/cron.hourly) Jul 3 11:20:42 h129009 -- MARK -- Jul 3 11:40:42 h129009 -- MARK --
Das OS ist ein SuSE9.2 mit dem original Stratokernel (zwischendurch auch schon mit anderen Kerneln aus dem SuSE update). Das sieht dann zusammen mit den hdparm parametern so aus:
    Have a lot of fun... h129009:~ # hdparm /dev/hda /dev/hda: multcount = 16 (on) IO_support = 0 (default 16-bit) unmaskirq = 0 (off) using_dma = 1 (on) keepsettings = 0 (off) readonly = 0 (off) readahead = 256 (on) geometry = 16383/255/63, sectors = 61492838400, start = 0 h129009:~ # h129009:~ # uname -a Linux h129009 2.6.8-24.16-default #1 Thu Jun 2 12:09:57 UTC 2005 i686 i686 i386 GNU/Linux h129009:~ #

Also bei Strato angerufen, Hardwaretest gestartet aber nix gefunden. Was jetzt? Ich meine den Server so zu betreiben macht keinen Sinn, aber austausch gibts nur wenn der Hardwaretest einen Fehler bringt. Dafür müste der aber wahrscheinlich erstmal 2-3 Wochen laufen, in der Zeit wäre halt dann der Server net da. Hat es schon mal jemand geschafft Strato zu einem Umtausch zu bewegen auch wenn der Hardwaretest keine Fehler gebracht hat oder hab ich was übersehen?

Anonymous

Re: Hardwareproblem bei Strato

Post by Anonymous » 2005-07-05 11:13

Ich würde jetzt spontan mal auf einem Fehler im RAM tippen.

Memtest86 drüberlaufen lassen und Fehler zählen :lol:

braindead
RSAC
Posts: 257
Joined: 2002-10-22 09:49
Location: vorm Rechner

Re: Hardwareproblem bei Strato

Post by braindead » 2005-07-05 14:44

Fehleranzahl nach 71 Durchläufen mit 0 Fehlern abgebrochen ... das wars wohl leider net ;)

Ich bin mir wie gesagt relavit sicher das es die Platte ist, nur der Fehler tritt halt leider net immer auf und ist deshalb schwer zu beweisen.

User avatar
Joe User
Project Manager
Project Manager
Posts: 11583
Joined: 2003-02-27 01:00
Location: Hamburg

Re: Hardwareproblem bei Strato

Post by Joe User » 2005-07-05 14:51

Lass die Platte überwachen (smartmontools) und optimiere sie etwas:

Code: Select all

hdparm -d1c1u1m16
PayPal.Me/JoeUserFreeBSD Remote Installation
Wings for LifeWings for Life World Run

„If there’s more than one possible outcome of a job or task, and one
of those outcomes will result in disaster or an undesirable consequence,
then somebody will do it that way.“ -- Edward Aloysius Murphy Jr.

braindead
RSAC
Posts: 257
Joined: 2002-10-22 09:49
Location: vorm Rechner

Re: Hardwareproblem bei Strato

Post by braindead » 2005-07-05 16:45

Optimieren will ich die Platte im Moment eigentlich nicht, sondern erstmal zusehen das der Server wieder stabil läuft.

Das mit dem überwachen mit den smartd ist ne gute idee. Werde ich gleich mal angehen.