Server unerreichbar

Alles was in keine andere Systemkategorie passt
tsukasa
Posts: 13
Joined: 2004-04-15 23:26

Server unerreichbar

Post by tsukasa »

Hallo, ich habe mir mal vorgenommen, dieses Unterforum zu "eröffnen".

Ich habe folgendes Problem:
Zur schnelleren Verarbeitung von PHP Seiten habe ich mir den APC Cache installiert. In der installierten Version war ein Bug vorhanden, der mit der Zeit immer mehr Dateien öffnete, sodass das Limit erreicht war und keine PHP Seite mehr ausgeführt wurde. Anschließend habe ich das APC aktualisiert, jedoch wollte ich um auf Nummer sicher zu gehen den Server neu starten.. dabei ist es auch geblieben, denn er fährt nun nichtmehr hoch. Über die serielle Konsole ist ebenfalls überhaupt kein Output zu sehen. Nichtmal eine Fehlermeldung. Ebenfalls bezweifel ich auch stark, dass das irgendetwas mit APC zu tun hat
Im Recovery Modus (der noch läuft.. welche wunder, ist ja ein image) konnte ich jedoch auch keine Fehlermeldungen feststellen. Der letzte Eintrag ist der Shutdown vom Server. Danach nichts mehr.

Hat irgendjemand eine Idee, was da schiefgelaufen sein kann? Eventuell ein Hardwarefehler?

System: openSuSE 10.2 mit Plesk und all dem Schmarn von 1und1

wgot
Posts: 1675
Joined: 2003-07-06 02:03

Re: Server unerreichbar

Post by wgot »

Hallo,

auf die Festplatte kannst Du im Rescue problemlos zugreifen? - Dann ist Hardware unwahrscheinlich.

Vermutlich hat Dir Yast/You beim leztzten Update den Suse-Standardkernel aufgespielt, mit dem booten aber die (meisten) 1+1-Server nicht.

Zeig mal die lilo.conf und schau nach, wann die zuletzt geändert wurde, außerdem bitte den Inhalt des Bootverzeichnisses auf der gemounteten Platte in Langversion (ls -al).

Gruß, Wolfgang

tsukasa
Posts: 13
Joined: 2004-04-15 23:26

Re: Server unerreichbar

Post by tsukasa »

Hallo,

vielen Dank für die Antwort. Um das Problem schnell zu Umgehen, hatte ich kurzerhand den Server neu intialisiert. Allerdings ist heute exakt das selbe Problem wieder aufgetaucht. Nach einem Neustart geht wieder nichts. Diesmal hatte ich vor dem Neustart PHP geupdated. Allerdings ist mir dabei aufgefallen, dass durch ein weiteres Programm im Hintergrund die / Partition (auf der u.a. /boot und /etc liegt) volllief, da es ununterbrochen Dateien erstellt hat.
Könnte das Problem damit zusammenhängen? Natürlich hatte ich die Dateien wieder gelöscht und es sind wiederum nur 12% der Partition belegt, aber Neustarten lässt der Server sich trotzdem nicht.

lilo.conf:

Code: Select all

boot=/dev/sda
root=/dev/md1

install=/boot/boot.b
vga=normal
timeout=60
prompt
lba32

read-only

default = lxser

serial=0,57600n8
append="console=ttyS0,57600 console=tty0"


image = /boot/vmlinuz
    label = lxser
    append = " console=tty0 console=ttyS0,57600 panic=30"


image = /boot/vmlinuz
    label = lx
/boot Verzeichnis:

Code: Select all

rescue:/boot# ls -al
total 9440
drwxr-xr-x  4 root root    4096 Jun 19 11:06 .
drwxr-xr-x 22 root root    4096 Jun 19 10:20 ..
-rw-r--r--  1 root root 1463070 May  7 08:13 System.map-2.6.24.7-20080507a
-rw-r--r--  1 root root 1539546 Jun 16 09:53 System.map-2.6.25.6-20080616a
-rw-------  1 root root     512 Sep 19  2007 backup_mbr
lrwxrwxrwx  1 root root       1 Jun 18 12:17 boot -> .
-rw-r--r--  1 root root     512 Jun 18 12:19 boot.0800
-rw-r--r--  1 root root     512 Jun 18 12:19 boot.0810
-rw-r--r--  1 root root   39407 May  7 08:03 config-2.6.24.7-20080507a
-rw-r--r--  1 root root   42207 Jun 16 09:45 config-2.6.25.6-20080616a
drwxr-xr-x  2 root root    4096 Oct 31  2007 grub
drwx------  2 root root   49152 Jun 18 12:19 lost+found
-rw-------  1 root root   79360 Jun 18 12:19 map
-rw-------  1 root root  379904 Sep 19  2007 message
lrwxrwxrwx  1 root root      26 Jun 18 12:17 vmlinuz -> vmlinuz-2.6.25.6-20080616a
-rw-r--r--  1 root root 2906936 May  7 08:13 vmlinuz-2.6.24.7-20080507a
-rw-r--r--  1 root root 3104600 Jun 16 09:53 vmlinuz-2.6.25.6-20080616a
lrwxrwxrwx  1 root root      26 Jun 18 12:17 vmlinuz.old -> vmlinuz-2.6.24.7-20080507a

wgot
Posts: 1675
Joined: 2003-07-06 02:03

Re: Server unerreichbar

Post by wgot »

Hallo,

Du hast bei 1&1 vermutlich eine serielle Konsole / Remotekonsole. Was wird angezeigt wenn Du darin den Bootvorgang beobachtest?

Hast Du gestern 12:17 ein Kernelupdate durchgeführt? Danach Lilo-Aufruf durchgeführt?
(Das Kernelupdate erfolgte nicht über Yast, entweder manuell oder als Bestandteil einer Neuinstallation)

Mounten und chrooten, danach lilo aufrufen, exit und umount, Normalmodus booten.

Gruß, Wolfgang

tsukasa
Posts: 13
Joined: 2004-04-15 23:26

Re: Server unerreichbar

Post by tsukasa »

Ja, gestern war auf dem Server ebenfalls eine Neuinitialisierung. Danach lief aber alles wunderbar, bis heute Mittag.

Die serielle Konsole scheint hier überhaupt keinen Nutzen zu haben, denn der Output ist gleich Null. Das heißt, sie gibt keine einzige Meldung aus, wenn ich im normalen Modus boote.

wgot
Posts: 1675
Joined: 2003-07-06 02:03

Re: Server unerreichbar

Post by wgot »

Hallo,

wird langsam schwierig. :cry:

Ich würde folgendes probieren:

1) Festplatte prüfen (smartctl, geht auch im Rescue)
2) Neuinstallation, nichts ändern und mehrfach rebooten. Die Reboots auf der seriellen Konsole beobachten.

Gruß, Wolfgang

tsukasa
Posts: 13
Joined: 2004-04-15 23:26

Re: Server unerreichbar

Post by tsukasa »

Jetzt kommt das beste:

Es läuft nichtmal mehr das rescue System. Was die da bei 1und1 manchmal machen ist wirklich mehr als fragwürdig..
Nach geschlagenen 25 Minuten am Telefon (und 3€ mehr auf der Telefonrechnung), sowie der Einsicht des Support-Mitarbeiters, dass der Server definitiv überhaupt nicht mehr bootet, egal welcher Boot-Modus, wird die Sache wohl an die Administration weitergeleitet. Mal sehen was die finden...


Jedenfalls vielen Dank wgot für die schnellen Antworten. So ein kompetentes Forum ist wirklich nicht durch irgendwelchen Telefon-Support zu ersetzen... :roll: