Page 1 of 2

Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-23 17:14
by krackman
Hallo,

mein Server schmiert alle paar Stunden total ab. Er lässt sich nur noch durch ein Reset per Webinterface wiederbeleben.
Mal schmiert er schon nach 2 Stunden ab, dann nach 1,5 Tagen und danach wieder nach 5-6 Stunden.

In den Logfiles steht dazu leider absolut nichts.
Ich denke das es an einem fehlerhaft konfigurierten Kernel (2.4.26) liegt.
Hier habe ich mal die .config Datei.

Der Server dient für web / ftp / mail / irc Dienste.

Hab ich den Kernel komplett falsch konfiguriert oder an was könnte es noch liegen ?

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-23 17:41
by captaincrunch
1. Du hast massenhaft unnützes Zeug im Kernel. Einfaches Beispiel, das dazu noch Probleme versuchen kann ist ACPI.

2. Warum bindest du alles (oder wenigstens das Meiste) fest, und nicht als Modul ein, wenn du schon den odulsupport aktivierst?
Gerade bei den Filesystemen kannst du dir damit böse ins Knie schießen.

Um was für einen Server handelt es sich? Standard 1&1?

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-24 00:09
by krackman
Hi,

es ist der Strato SR.
Das mit den Modulen hab ich mir auch schon überlegt :)

Ich versuch da jetzt noch mal kräftig aufzuräumen.

Was brauch ich den unbedingt für den einwandfreien Betrieb im Kernel ?

Schon mal vielen Dank im voraus!

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-24 08:43
by captaincrunch
Schau dir mal die configs unter http://linux.roothell.org/kernel/ an, darauf kannst du aufbauen...streng genommen sollte es reichen, wenn du den Support für die serielle Schnittstelle aktiverst. ;)

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-24 20:15
by krackman
Hallo,

erstmal danke für die Hilfe.

Aber ich bin anscheind zu blöd dazu ...
Der Server ist jetzt schon wieder nach 3 Stunden abgeschmiert.

Ich habe einen kompletten Neuversuch mit dem 2.4.26-grsec-2.0 Kernel gestartet und vorher /usr/src/* komplett gelöscht.

Hier hab ich nochmal die neue config Datei

Ich denke das die Konfiguratin schon ein ganzes Stück besser ist, aber ich versteh immer noch nicht warum diese *piep* Kiste immer wieder abschmiert ohne jeglichen Logeintrag.

Ich bin schon kurz davor den Server per Webinterface neu installieren zu lassen und dann noch mal von vorne anzufangen !

Was mach ich falsch ? :roll:

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-24 20:29
by sascha
Ich würde dir tatsächlich empfehlen den Server mal neu installieren zu lassen und dann nichts großartig zu verändern. Falls er dann weiterhin regelmäßig abschmiert solltest du dich mal an den Support wenden.

BTW: Hardware schonmal grob mit lm-sensors oder mbmon und smartmontools gecheckt?

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-24 20:36
by krackman
Hallo,

das habe ich noch nicht gemacht.

Hab ich aber gerade vor.
Ich hoffe mal das es nach der Neuinstallation geht, wenn nicht dann muss es ja ein Hardwaredefekt etc. sein.

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-24 22:17
by krackman
Server ist neu installiert.
Aber jetzt besteht immer noch ein anderes Problem:
Der Server ist nach Einwahl in das Internet per EWE-Tel nicht erreichbar.
Wähle ich mich testweise mit T-Online ein, geht es ohne Probleme.

Vor der Neuinstallation hab ich noch gedacht das ich irgendwas falsch gemacht habe, weil es schon mal ging.
Seit knapp 2 Tagen ist der Server als EWE-Tel Flatrate Benutzer nur noch per RemoteConsole erreichbar.
Auch der Versuch mich vom Server aus zu pingen schlägt fehl.

Mit T-Online (Ich zum Server):

Routenverfolgung zu h4058.serverkompetenz.net [81.169.171.22] über maximal 30 Abschnitte:

1 36 ms 36 ms 36 ms 193.158.138.117
2 35 ms 34 ms 34 ms 217.89.23.190
3 44 ms 43 ms 45 ms f-ea3.F.DE.net.DTAG.DE [62.154.17.54]
4 44 ms 43 ms 43 ms so-1-3-0-crj1-FFM1.de.cw.net [62.208.234.137]
5 67 ms 66 ms 66 ms so-0-1-0-crj1-HBG2.de.cw.net [62.208.240.102]
6 59 ms 58 ms 57 ms so-0-2-0-crj1-BCX.de.cw.net [62.208.240.70]
7 62 ms 58 ms 58 ms strato-gw-BCX.de.cw.net [194.221.42.86]
8 64 ms 59 ms 58 ms 81.169.160.34
9 62 ms 65 ms 61 ms shells4player.de [81.169.171.22]

Ablaufverfolgung beendet.

Mit T-Online (Server zur mir):

tracepath 62.158.117.128
1?: [LOCALHOST] pmtu 1500
1: 81.169.171.2 (81.169.171.2) 0.855ms
2: 81.169.160.33 (81.169.160.33) 0.632ms
3: ge-0-0-0-173-crj1-BCX.de.cw.net (194.221.42.85) asymm 4 1.021ms
4: dtag-gw-BER1.de.cw.net (194.221.42.74) 1.060ms
5: hb-rg1.HB.DE.net.DTAG.DE (62.154.72.134) asymm 7 23.228ms
6: 193.158.138.117 (193.158.138.117) asymm 8 27.570ms
7: p3E9E7580.dip.t-dialin.net (62.158.117.128) asymm 9 273.040ms reached
Resume: pmtu 1500 hops 7 back 9

Mit EWE-Tel (Ich zum Server):

Routenverfolgung zu h4058.serverkompetenz.net [81.169.171.22] über maximal 30 Abschnitte:

1 38 ms 35 ms 35 ms 212.6.112.117
2 35 ms 35 ms 35 ms 212.6.112.97
3 79 ms 79 ms 76 ms so1-1-2-bbrt8.ol.ewe-ip-backbone.de [80.228.21.17]
4 69 ms 66 ms 64 ms ge0-2-0-bbrt9.ol.ewe-ip-backbone.de [212.6.111.9]
5 67 ms 71 ms 67 ms so0-0-0-bbrt4.ffm.ewe-ip-backbone.de [212.6.94.2]
6 62 ms 62 ms 65 ms ffm-s2-rou-1071.DE.eurorings.net [80.81.192.22]
7 93 ms 103 ms 97 ms ffm-s1-rou-1001.DE.eurorings.net [134.222.227.133]
8 132 ms 128 ms 130 ms hmb-s2-rou-1001.DE.eurorings.net [134.222.230.118]
9 104 ms 102 ms 103 ms hmb-s2-rou-1002.DE.eurorings.net [134.222.230.110]
10 108 ms 107 ms 104 ms blnb-s1-rou-1003.DE.eurorings.net [134.222.227.246]
11 59 ms 58 ms 63 ms eurorings-gw.strato.de [134.222.98.254]
12 60 ms 59 ms 64 ms 81.169.160.62
13 * * * Zeitüberschreitung der Anforderung.
14 * * * Zeitüberschreitung der Anforderung.


Mit EWE-Tel (Server zu mir):

tracepath 80.228.135.111
1?: [LOCALHOST] pmtu 1500
1: 81.169.171.2 (81.169.171.2) 0.968ms
2: 81.169.160.33 (81.169.160.33) 0.760ms
3: no reply
4: no reply


Find das alles SEHR komisch.
Vom Server aus kann ich zum Beispiel auch telekom.de und strato.de anpingen, aber heise.de und rootforum.org/ nicht.
Weder mit Domainname, noch mit der IP Adresse.

Von mir lokal aus kann ich die 81.169.171.22 (mein Server) mit EWE-Tel nicht pingen, aber die 81.169.171.21 und 81.169.171.23 ja.

Ich glaub die Hardware hat ne Macke.

An dem Server hab ich noch der Neusinstallation noch nichts verändert.

Alles sehr komisch ...
Mal sehen ob der Server jetzt immer noch abschmiert.

Bin ich zu doof oder liegt das am Server ?

*edit*

Dieses Problem hat sich von alleine gelöst, war wohl nur nen kleines Routingprob

*/edit*

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-26 20:31
by krackman
Der Server macht mich noch irre:

Hab versucht erneut Gentoo zu installieren.
Diesmal wollte ich es beginnend mit Stage1 versuchen.
Beim bootstrapen bekomm ich immer wieder den Fehler: "Segmentation fault" an unterschiedlichen Stellen.

Das Problem wird im Gentoo Forum auch x-mal behandelt, dort ist es meistens der Verdacht auf einen Hardwareschaden.

Dann hab ich nen paar Test´s laufen lassen:

memcheck86 (ram): läuft ohne Fehler durch

prime95 (cpu): Torture Test ran 4 hours, 44 minutes - 0 errors, 0 warnings.

Smartmontools (hdd): === START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 1912 -

mbmon: Temp.= 28.0, 0.0, 28.5; Rot.= 3835, 0, 0
Vcore = 1.52, 3.23; Volt. = 3.34, 5.03, 11.92, -12.37, -2.08

Für mich sehen die Ausgaben OK aus, also schließ ich mal einen Hardwarschaden aus.
"Agressive" Flags hab ich in der make.conf auch nicht benutzt.

An was kann das liegen ?!?!

PS: Als was trägt man ein Celeron 2,4 Ghz ein ? In der Org. Kernel .config steht der als P3 drin, memcheck86 zeigt den als P4 an. Was ist denn jetzt richtig ?

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-26 21:04
by oxygen
Die P4 Flags machen wohl noch Probleme, von daher würde ich auf P3 gehen, auch wenn eigentlich ein P4 Kern drin steckt.

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-26 21:35
by Joe User
-march=pentium4 führt, ebenso wie -O3, wie øxygen bereits andeutete, zu (nicht) reproduzierbaren Fehlern beim Kompilieren diverser Sourcen. Für Produktiv-Systeme sollte man maximal folgende Flags setzen:

Code: Select all

# Gentoo Standard
CHOST="i686-pc-linux-gnu"
CFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer"
CXXFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer"
USE="... mmx sse"

# Gentoo Hardened
CHOST="i686-pc-linux-gnu"
CFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer -fstack-protector"
CXXFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer -fstack-protector"
USE="... hardened pic mmx sse"

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-26 21:42
by captaincrunch
-march=pentium4 führt, ebenso wie -O3, wie øxygen bereits andeutete, zu (nicht) reproduzierbaren Fehlern beim Kompilieren diverser Sourcen.
Kann ich persönlich nicht bestätigen... :?

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-26 21:45
by Joe User
IIRC verwendest Du auch kein SSP/PIE ;)

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-26 21:51
by captaincrunch
Davon hatte ich auch in deinem Post nichts gelesen. ;)

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-27 11:21
by Joe User
SSP/PIE sind seit Gentoo 2004.0 auch im nicht hardened default ;)

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 13:45
by krackman
ich geb´s auf ...

egal ob stage1, stage2 oder stage3.

nach 2-24 stunden schmiert der server wieder ab.
kernel schon mit allen möglichen eistellungen kompiliert usw.

ich bekomm es einfach nicht hin das gentoo stabil läuft.
dazu immer segmentation fault fehler, egal wie ich die flags in der make.conf setze.

gibt es da einen trick oder bin ich nur zu doof ?!?! :?

redhat & co server laufen bei mir lokal auch ohne schwierigkeiten, nur gentoo schmiert immer auf dem strato server ab.

zum kotzen !

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 13:51
by captaincrunch
Segfaults klingen in ganz vielen Fällen eher nach Problmen mit dem Speicher. Auch memtest86 macht ab und an Fehler...

Sind aber nur Vermutungen, da eine genaue Analyse hier kaum machbar ist.

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 16:47
by Joe User
Welchen Kernel-Source verwendest Du?
Lege bitte nochmals Deine .config zum DL bereit.

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 19:29
by krackman
Joe User wrote:Welchen Kernel-Source verwendest Du?
Lege bitte nochmals Deine .config zum DL bereit.
Ich habe den Server jetzt neuinstallieren lassen.
Wenn Suse 8.x jetzt stabil durchläuft, muss es am Kernel liegen.
Crasht der Server weiterhin alle paar Stunden kann ich mir ziemlich sicher sein das es ein Hardwaredefekt ist.

Die .config vom Kernel ist leider mit der Neuinstalltion verloren gegangen.

Eventuell starte ich heute noch einen Versuch mit Gentoo 2004.1 !

Welche stage1-Datei ist für den Celeron 2400 besser.
Die P3 oder P4 ?

Momentan finde ich die stage1 Datien von 2004.1 nur für x86 (stage1-x86-2004.1.tar.bz2). Von Hardended ist auch noch nichts zu sehen.

Mach ich jetzt einen Denkfehler oder muss ich einfach noch länger warten bis die Mirror´s endgültig befüllt sind ?

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 20:43
by Joe User
Ich hab's folgendermassen gemacht:

1.) http://gentoo.inode.at/releases/x86/200 ... .1.tar.bz2 geladen, die anderen Mirrors sind (fast) alle überlastet

2.) Normales Mini-Setup mit:

Code: Select all

cat > /etc/make.conf << "EOF"
CHOST="i686-pc-linux-gnu"
CFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer"
CXXFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer"
USE="-* acl berkdb caps crypt gdbm gmp ipv6 memlimit mmx ncurses nls nocd pam perl pic pwdb python readline sse ssl X509 zlib"
GENTOO_MIRRORS="http://gentoo.oregonstate.edu http://www.ibiblio.org/pub/Linux/distributions/gentoo"
SYNC="rsync://rsync.gentoo.org/gentoo-portage"
ACCEPT_KEYWORDS="~x86"
EOF
3.) emerge development-sources

4.) Nach dem Reboot ein emerge -Deu world mit:

Code: Select all

cat > /etc/make.conf << "EOF"
CHOST="i686-pc-linux-gnu"
CFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer -fstack-protector -fstack-protector-all"
CXXFLAGS="-O2 -pipe -march=pentium3 -fomit-frame-pointer -fstack-protector -fstack-protector-all"
USE="-* acl berkdb bootstrap caps crypt gdbm gmp hardened ipv6 memlimit mmx ncurses nls nocd nptl pam perl pic pwdb python readline sse ssl X509 zlib"
GENTOO_MIRRORS="http://gentoo.oregonstate.edu http://www.ibiblio.org/pub/Linux/distributions/gentoo"
SYNC="rsync://rsync.gentoo.org/gentoo-portage"
ACCEPT_KEYWORDS="~x86"
EOF
5.) Erneuter Reboot und emerge $Rest

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 20:47
by sascha
Stage 1 gibts natürlich nur für x86. Alles andere würde auch keinen Sinn machen ;).

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 21:02
by Joe User

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 21:36
by oxygen
ACCEPT_KEYWORDS="~x86" auf einer Produtiven Maschine? das halte ich mal für gewagt. Aber wenn, dann würde ich auch nptl benutzen...

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 21:44
by Joe User
nptl ist ohne ~x86 für einen Server noch nicht stabil genug...

Re: Gentoo & Kernel 2.4.26: Server stirbt alle paar Stunden

Posted: 2004-04-28 21:51
by oxygen
Achso, jetzt sehe ich erst, das sich deine USE Flags von einer make.conf zur nächsten geändert haben... ich habe nur in der oberen gesehen, dass nptl fehlt.