Server geht einfach aus
Server geht einfach aus
Also ich habe folgendes Problem. Ich habe mich dank meiner vielen freien Zeit momentan etwas mit openvz beschäftigt. Es ist eine wirklich geniale Sache und ich hab schon viele Ideen für Einsatzmöglichkeiten. Nun aber zu meinem Problem. Der Server (HN: Debian 4.0 2.6.18-12-fza-686 512 MB Ram 2GB Swap vzctl version 3.0.22-1dso1) geht einfach mitten in der Nacht aus. Was genau passiert konnte ich nicht feststellen, denn alle Logdateien enden einfach gegen 3:30 ohne Fehler. Einen Hardwaredefekt wollte ich erst ausschließen, denn der Server ist erst 3 Tage alt. Auf dem Server lauen nur einige Programme mit denen ich OpenVZ getestet habe, also keine großen Serveranwendungen.
Ich bin wirklich ratlos was da passiert, aber ich habe dennoch ein paar Ideen:
1. Irgendwie entsteht auf den VMs eine Spitzenlast zur gleichen Zeit (Sind ja vom gleichen Template). Problem: Warum macht der Server keine Logdateien zum Fehler?
2. Es ist ein mir unbekannter Bug (Im Irc Channel von openVz wusste auch keiner einen Weg)
3. Die neue Hardware ist auch wieder kaputt
Eventuell kennt ja jemand von euch einen ähnlichen Fehler in Verbindunh mit OpenVZ?
Ich werde mich auf jedenfall Heute Nacht auf die Lauer legen und mal beobachten was passiert. Ich denke ich logge /proc/user_beancounters und die laufenden Prozesse alle 10 Sekunden (Solle ich noch etwas überwachen?).
Ich bin wirklich ratlos was da passiert, aber ich habe dennoch ein paar Ideen:
1. Irgendwie entsteht auf den VMs eine Spitzenlast zur gleichen Zeit (Sind ja vom gleichen Template). Problem: Warum macht der Server keine Logdateien zum Fehler?
2. Es ist ein mir unbekannter Bug (Im Irc Channel von openVz wusste auch keiner einen Weg)
3. Die neue Hardware ist auch wieder kaputt
Eventuell kennt ja jemand von euch einen ähnlichen Fehler in Verbindunh mit OpenVZ?
Ich werde mich auf jedenfall Heute Nacht auf die Lauer legen und mal beobachten was passiert. Ich denke ich logge /proc/user_beancounters und die laufenden Prozesse alle 10 Sekunden (Solle ich noch etwas überwachen?).
Re: Server geht einfach aus
Bei welchem Anbieter steht der Server denn?
lg Basti
lg Basti
Re: Server geht einfach aus
Strato, Ist das denn wichtig?
Re: Server geht einfach aus
Wichtig eigentlich nicht, es gibt nur bei Hetzner mmt. im RZ9 Probleme mit der Temperatur,
da gingen gestern Nachmittag einige Server aus. Aber man soll ja alles Mögliche in Betracht ziehen
lg Basti
da gingen gestern Nachmittag einige Server aus. Aber man soll ja alles Mögliche in Betracht ziehen
lg Basti
Re: Server geht einfach aus
Vermutlich wird es eine Kernel Panic sein. Du kannst vielleicht versuchen dir die Fehlermeldung mit netconsole irgendwo anders hin zu hohlen. Oder über ein serielle Konsole falls vorhanden. Dann siehst du ob es sich z.B. um ein OOM Killer handelt.
Re: Server geht einfach aus
OOM Killer sollten doch eigentlich geloggt werden, oder...?
Re: Server geht einfach aus
Wenn du pech hast und es Syslog oder init als erstes erwischt, nicht.
Re: Server geht einfach aus
Also Heute Nacht ist es nicht passiert. Ich hab mir auch mal eine große Tabelle mit allen möglichen CPU, RAM, beancounters usw. gebastelt. Keiner der Abgefragten Werte war auch nur am Rand von irgendeinem Limit. Ich werde das jetzt mal eine Weile beobachten.
-
froschlein
- Posts: 19
- Joined: 2008-12-01 07:50
Re: Server geht einfach aus
Was bedeutet denn "Neue Hardware ist auch wieder kaputt"?
Re: Server geht einfach aus
War jetzt länger nicht mehr hier. Aber wenn jemand ein ähnliches Problem hat und die Lösung sucht will ich mein Ergebnis kundtun: Die betreffende Hardware war tatsächlich physisch kaputt. Ist aber nur interessant, wenn sich jemand für Strato entscheidet, mein Eindruck: Service war positiv, aber kaputte Hardware zweimal als neue Ausgeben sehr negativ (Kann aber mal passieren).
Da ich auf Systemen mit vielen VZs ähnliche Probleme hatte noch ein kleiner Tipp: Monitoring Werkezeuge nur in VZs einsetzen, wenn die einzelnen Cronjobs asynchron laufen (Kann sonst ziemlich seltsame Effekte auslösen). Am besten nur auf dem Hostnode und mit Scripten auf die VZs zugreifen um wichtige Daten zu bekommen.
Da ich auf Systemen mit vielen VZs ähnliche Probleme hatte noch ein kleiner Tipp: Monitoring Werkezeuge nur in VZs einsetzen, wenn die einzelnen Cronjobs asynchron laufen (Kann sonst ziemlich seltsame Effekte auslösen). Am besten nur auf dem Hostnode und mit Scripten auf die VZs zugreifen um wichtige Daten zu bekommen.
Last edited by darkeye on 2009-11-06 12:30, edited 1 time in total.
