Servertotalausfall - Gruende herleiten

Apache, Lighttpd, nginx, Cherokee
bennle
Posts: 77
Joined: 2005-06-09 17:56
 

Servertotalausfall - Gruende herleiten

Post by bennle »

Hallo,
Ich moechte hier mal erfragen, wie ich am besten einen Servertotalabsturzgrund finde.
Derzeit lese ich immer in den Logs, welche eigentlich aufschluss geben sollten. Jedoch ist das momentan nicht der Fall. Ich finde keinen Fehler und weiß natuerlich auch nicht wer diesen verursacht. (momentan schaue ich das "warn" Protokoll durch)
Wie ght ihr vor, wenn Ihr nicht wisst woran es liegt und ihr auch im Log nichts findet? Ist es vielleicht hilfreich CPU/Ram-Last mit zu protokollieren?
Ehrlich gesagt weiß ich nicht weiter, anfangs dachte ich an einen CronJob, nur leider ist das nicht der Fall, da es unregelmaeßig auftritt. Jedoch meißtens nachts.
Die Probleme bestehen seit ca 1 Woche!
Gruß
Benny
User avatar
daemotron
Administrator
Administrator
Posts: 2641
Joined: 2004-01-21 17:44
 

Re: Servertotalausfall - Gruende herleiten

Post by daemotron »

Um solchen Situationen zu begegnen, führe ich Buch über Veränderungen an Konfigurationsdateien (sprich - ich speichere mir die älteren Versionen mit Datumsstempel zu Hause weg). Außerdem protokolliere ich Updates - dazu habe ich mir ein Shell-Skript geschrieben, das ich als Wrapper für die Paketmanagement-Tools meiner Distribution verwende und das nichts anderes tut, als alle durchgeführten Updates mit Zeitstempel zu protokollieren.

Normalerweise sind die Logs (v. a. kernel.log, dmesg etc.) aussagekräftig genug, um bei einem Absturz die Ursache ermitteln zu können (z. B. Speicher voll). Wenn nichts protokolliert wird, dann vermutlich, weil das Filesystem, auf dem /var untergebracht ist, aus dem Tritt gekommen ist - oder der Absturz eine phyische Ursache hatte, die nicht zu einem kontrollierten Absturz geführt hat, sondern den unmittelbaren Servertod herbeigeführt hat (Spannungsschwankung, defekte CPU oder Netzteil, beschädigtes Motherboard, tbc.)

Wenn Hardware-Probleme als Ursache nicht auszuschließen sind, lohnt sich - wie von Matthias bereits beschrieben - auf jeden Fall ein Blick auf die Ausgaben auf tty0 - wenn Du keinen seriell angeschlossenen Terminal-Server hast, stellt Dir der Provider vielleicht auf Anfrage eine LARA o. ä. zur Verfügung. Denn im Falle eines Plattendefekts oder eines ausgestiegenen Dateisystems bekommst Du zwar auf der Konsole noch entsprechende Fehlermeldungen zu sehen - die landen aber in keinem Logfile mehr, wie denn auch, wenn die Platte nicht mehr will...
bennle
Posts: 77
Joined: 2005-06-09 17:56
 

Re: Servertotalausfall - Gruende herleiten

Post by bennle »

Hallo,
Vielen Dank fuer die schnelle und genaue Beschreibung.
Ich habe mir das ebenfalls so aehnlich vorgestellt. Ich wer mal den Loglevel hochstellen! (syslog config?)
Ebenfalls ist das mit dem Stresstest eine gute Idee (Programmvorschlaege?)

Zugang ueber tty0 habe ich und daher ist das ganze gut machbar.

Ich kann mich erinnern ein Update des kernel's gemacht zu haben. Aber wie gehe ich zurueck? Ich hab mir zwar die vmlinuz gesichert, aber das reicht ja scheinabr nicht,da diese auf ein verzeichnis zurueck greifen moechte, welches ich leider vergessen habe. Ok, vielleicht selbst kompilieren (empfehlenswert?)

Dein Skript hat mich neugirig gemacht, funktioniert das Zufaellig mit Suse? Ist es unter GPL :)

Bitte entschuldigt die wirre Schreibweise, aber ich habe momentan nur das PDA zu Verfuegung.

Gruß
Benny
User avatar
Joe User
Project Manager
Project Manager
Posts: 11185
Joined: 2003-02-27 01:00
Location: Hamburg
 

Re: Servertotalausfall - Gruende herleiten

Post by Joe User »

<offtopic>
jfreund wrote:Außerdem protokolliere ich Updates - dazu habe ich mir ein Shell-Skript geschrieben, das ich als Wrapper für die Paketmanagement-Tools meiner Distribution verwende und das nichts anderes tut, als alle durchgeführten Updates mit Zeitstempel zu protokollieren.
Du hast also /var/log/emerge.log neu erfunden? ;)
</offtopic>
User avatar
daemotron
Administrator
Administrator
Posts: 2641
Joined: 2004-01-21 17:44
 

Re: Servertotalausfall - Gruende herleiten

Post by daemotron »

Joe User wrote:Du hast also /var/log/emerge.log neu erfunden?
Nein, ich sorge nur dafür, dass der Inhalt derselben nicht nur auf meinem Rootie liegt... just in case :wink: