Server (Suse 7.2) startet plötzlich nicht mehr
Posted: 2003-09-05 22:46
Ich geb's auf ... ich bin inzwischen völlig ratlos.
Unser Server läuft seit über einem Jahr eigentlich fast völlig problemlos. Nacht's lassen wir die Kiste immer ein paar Aufgaben automatischmachen (Datensicherung, Traffic ermitteln, u.ä.) und dann per shutdown -r neu booten. Auch das klappt immer einwandfrei. Bis heute morgen. Da kam er nicht wieder hoch.
Erste Idee: irgendwas ziwchen gestern abend und heute morgen hat die Kiste zum abschmieren gebracht und dabei das Filesystem so versaut, daß der automatische fsck nicht will und damit bootet er nicht durch.
Also ... Rescue System aktiviert und manuell ran an die Sache. Aber ... oh Wunder ... beide Partitionen (hda1 und hda3) sind clean.
In /va/log sehen messages und boot.msg ebenfalls ganz normal aus. Das letzte was dort protokolliert ist sind die Dinge vom Runterfahren/Rebootversuch d.h. der Wechsel auf init 6 ... sieht alles absolut normal aus.
Also ... nächste Idee: irgendwas mit dem MBR und/oder Kernel ist nicht ok.
Also per lilo diverses probiert, von einfachem Neuschreiben des MBR über Uninstall/Neuinstall des Bootloaders über Reaktivieren eines älteren gesicherten Kernels bis zum installieren eines "sauberen" kernel-2.4.18 Archivs vom updateserver.
Nix. Bei keinem der Versuche tut sich irgendwas an den Filesystemen. Die sind immer sauber, nix Neues in den /var/log Protokollen da bleiben nur die alten Sachen von heute morgen/gestern. Im /etc/init.d/rc hatte ich auch mal ein touch/sync untergebracht, um zu sehen, ob er da vorbeikommt, aber falls er überhaupt von der Platte bootet, dann kommt er da definitiv nicht mehr an.
Mir fällt nichts mehr ein. Jedenfalls nichts was ich noch testen könnte. Das einzige was mir überhaupt noch in den Sinn kommt, ist daß er überhaupt nicht von der Platte bootet, weil irgendwas im BIOS versaut ist oder so ... aber das scheint mir doch auch arg unwahrscheinlich. Aber ansonsten macht die Kiste ja einen ordentlichen Eindruck. Sie bootet das Rescue-System ... von dort kann ich die Partionionen prüfen (und sie sind wie gesagt clean) und mounten und darauf sieht auch alles soweit ich das beurteilen kann ok aus.
Irgendjemand irgendwelche Vorschläge? Ich bin sozusagen "verzweifelt". :(
Unser Server läuft seit über einem Jahr eigentlich fast völlig problemlos. Nacht's lassen wir die Kiste immer ein paar Aufgaben automatischmachen (Datensicherung, Traffic ermitteln, u.ä.) und dann per shutdown -r neu booten. Auch das klappt immer einwandfrei. Bis heute morgen. Da kam er nicht wieder hoch.
Erste Idee: irgendwas ziwchen gestern abend und heute morgen hat die Kiste zum abschmieren gebracht und dabei das Filesystem so versaut, daß der automatische fsck nicht will und damit bootet er nicht durch.
Also ... Rescue System aktiviert und manuell ran an die Sache. Aber ... oh Wunder ... beide Partitionen (hda1 und hda3) sind clean.
In /va/log sehen messages und boot.msg ebenfalls ganz normal aus. Das letzte was dort protokolliert ist sind die Dinge vom Runterfahren/Rebootversuch d.h. der Wechsel auf init 6 ... sieht alles absolut normal aus.
Also ... nächste Idee: irgendwas mit dem MBR und/oder Kernel ist nicht ok.
Also per lilo diverses probiert, von einfachem Neuschreiben des MBR über Uninstall/Neuinstall des Bootloaders über Reaktivieren eines älteren gesicherten Kernels bis zum installieren eines "sauberen" kernel-2.4.18 Archivs vom updateserver.
Nix. Bei keinem der Versuche tut sich irgendwas an den Filesystemen. Die sind immer sauber, nix Neues in den /var/log Protokollen da bleiben nur die alten Sachen von heute morgen/gestern. Im /etc/init.d/rc hatte ich auch mal ein touch/sync untergebracht, um zu sehen, ob er da vorbeikommt, aber falls er überhaupt von der Platte bootet, dann kommt er da definitiv nicht mehr an.
Mir fällt nichts mehr ein. Jedenfalls nichts was ich noch testen könnte. Das einzige was mir überhaupt noch in den Sinn kommt, ist daß er überhaupt nicht von der Platte bootet, weil irgendwas im BIOS versaut ist oder so ... aber das scheint mir doch auch arg unwahrscheinlich. Aber ansonsten macht die Kiste ja einen ordentlichen Eindruck. Sie bootet das Rescue-System ... von dort kann ich die Partionionen prüfen (und sie sind wie gesagt clean) und mounten und darauf sieht auch alles soweit ich das beurteilen kann ok aus.
Irgendjemand irgendwelche Vorschläge? Ich bin sozusagen "verzweifelt". :(