1&1-rootserver: relaylock und andere produzieren segfaults

hifims
Posts: 3
Joined: 2009-04-06 21:08

1&1-rootserver: relaylock und andere produzieren segfaults

Post by hifims »

Hi admins,

ich bin mit einem neuen 1&1-root-server am verzweifeln. Alle paar Jahre holt man sich ja einen Zweiten und zieht auf den Neuen um.

Mitte Februar wurde er mir zunächst mit openSuse 10.3 zur verfügung gestellt. Die mysql-DB stürzte bei einfachen Querys auf eine fast leere Datenbank ab.
Per mysql-console konnte ich die Ursache eingrenzen: Kürzte ich den (wordpress-)query um seine 'order by' Klausel, antwortete mysql brav mit 0 results. Lies ich den query orginal hieß es entweder 'lost connection during query' oder mysql hing sich ganz auf. Gleichzeitig standen segfault-Zeilen in messages.

Der 1&1-Support half nicht wirklich, es gab den Hinweis das mitlerweile openSuse 11 zur Verfügung steht.
Also entschied ich mich zur Neuinstallation.

mysql läuft jetzt fehlerfrei, dafür stürzt relaylock ständig mit segfaults ab:

Code: Select all

Mar 15 19:47:39 prod-2 kernel: sw-engine-cgi[2609]: segfault at 18 ip 00000000006efea2 sp 00007fff5ed95290 error 4 in sw-engine-cgi[400000+6f6000]
Mar 15 19:48:04 prod-2 kernel: sw-engine-cgi[2691]: segfault at 18 ip 00000000006efea2 sp 00007fff5ed95290 error 4 in sw-engine-cgi[400000+6f6000]
Mar 15 19:48:25 prod-2 kernel: sw-engine-cgi[2836]: segfault at 18 ip 00000000006efea2 sp 00007fff5ed95290 error 4 in sw-engine-cgi[400000+6f6000]
...
Mar 18 11:16:14 prod-2 kernel: relaylock[4587]: segfault at 10 ip 00007f1ac82c655a sp 00007fffd0cd0db0 error 4 in libpthread-2.8.so[7f1ac82be000+16000]
...
Apr  6 21:19:43 server kernel: relaylock[22766]: segfault at ffffffff9b0c17b8 ip 00007fa655b1cb30 sp 00007fff5df7d890 error 4 in libsqlite3.so.0.8.6[7fa655add000+81000]
Apr  6 21:19:47 server kernel: relaylock[22785]: segfault at ffffffff9b0c17b8 ip 00007f390badeb30 sp 00007fff13f3f850 error 4 in libsqlite3.so.0.8.6[7f390ba9f000+81000]
Apr  6 21:19:49 server kernel: relaylock[22789]: segfault at ffffffff9b0c17b8 ip 00007f519f20bb30 sp 00007fffa766bf80 error 4 in libsqlite3.so.0.8.6[7f519f1cc000+81000]
Apr  6 21:19:52 server kernel: relaylock[22806]: segfault at ffffffff9b0c17b8 ip 00007fe02d12db30 sp 00007fff3558dea0 error 4 in libsqlite3.so.0.8.6[7fe02d0ee000+81000]
Apr  6 21:19:54 server kernel: relaylock[22831]: segfault at ffffffff9b0c17b8 ip 00007f237ddffb30 sp 00007fff8625db70 error 4 in libsqlite3.so.0.8.6[7f237ddc0000+81000]
Apr  6 21:19:58 server kernel: relaylock[22868]: segfault at ffffffff9b0c17b8 ip 00007f1120bd2b30 sp 00007fff29032940 error 4 in libsqlite3.so.0.8.6[7f1120b93000+81000]
Apr  6 21:20:01 server /usr/sbin/cron[22904]: (mailman) CMD (/usr/bin/python -S /usr/lib/mailman/cron/gate_news)
Apr  6 21:20:02 server kernel: relaylock[22915]: segfault at ffffffff9b0c17b8 ip 00007f144587fb30 sp 00007fff4dce05f0 error 4 in libsqlite3.so.0.8.6[7f1445840000+81000]
Apr  6 21:20:04 server kernel: relaylock[22949]: segfault at ffffffff9b0c17b8 ip 00007f0183c1ab30 sp 00007fff8c078990 error 4 in libsqlite3.so.0.8.6[7f0183bdb000+81000]
Apr  6 21:20:06 server kernel: relaylock[22965]: segfault at ffffffff9b0c17b8 ip 00007fb087f30b30 sp 00007fff9038eca0 error 4 in libsqlite3.so.0.8.6[7fb087ef1000+81000]
Apr  6 21:20:08 server kernel: relaylock[22970]: segfault at ffffffff9b0c17b8 ip 00007f81771cab30 sp 00007fff7f62af40 error 4 in libsqlite3.so.0.8.6[7f817718b000+81000]
Apr  6 21:20:36 server kernel: relaylock[23111]: segfault at ffffffff9b0c17b8 ip 00007f1cf0c08b30 sp 00007ffff9068980 error 4 in libsqlite3.so.0.8.6[7f1cf0bc9000+81000]
Apr  6 21:20:44 server kernel: relaylock[23153]: segfault at ffffffff9b0c17b8 ip 00007f244c59eb30 sp 00007fff549fd310 error 4 in libsqlite3.so.0.8.6[7f244c55f000+81000]
Apr  6 21:21:01 server /usr/sbin/cron[23240]: (root) CMD (/usr/local/psa/admin/sbin/backupmng >/dev/null 2>&1)
Apr  6 21:21:08 server kernel: relaylock[23271]: segfault at ffffffff9b0c17b8 ip 00007fb6159ceb30 sp 00007fff1de2f740 error 4 in libsqlite3.so.0.8.6[7fb61598f000+81000]
Apr  6 21:21:15 server kernel: relaylock[23290]: segfault at ffffffff9b0c17b8 ip 00007ffbec0f3b30 sp 00007ffff4551e60 error 4 in libsqlite3.so.0.8.6[7ffbec0b4000+81000]
Apr  6 21:21:42 server kernel: relaylock[23400]: segfault at ffffffff9b0c17b8 ip 00007ffe95414b30 sp 00007fff9d875180 error 4 in libsqlite3.so.0.8.6[7ffe953d5000+81000]
Apr  6 21:21:52 server kernel: relaylock[23487]: segfault at ffffffff9b0c17b8 ip 00007f3f5750ab30 sp 00007fff5f96b270 error 4 in libsqlite3.so.0.8.6[7f3f574cb000+81000]
Apr  6 21:22:12 server kernel: relaylock[23578]: segfault at ffffffff9b0c17b8 ip 00007f016456cb30 sp 00007fff6c9cb2e0 error 4 in libsqlite3.so.0.8.6[7f016452d000+81000]


Ich meine das segfault's durch schlechten RAM oder durch Probleme mit dem installierten Betriebssystem bzw dessen libraries in Verbindung mit Speicherzugriffen zustande kommen.

Ein Nigelnagelneuer 1&1-Server schmeißt bei zwei 1&1-Installationen segfaults und der Support sagt mir nur ich müsse mich selber kümmern da nur ich weiß wie meine Software funktioniert und eingestellt ist. Hallo gehts noch? Als hätt ich irgendeine PHP-Applikation gestrickt die nicht läuft und würde jetzt sagen "macht mal fertig".
Aber hier gehts um die orginal out of the box 1&1-Installation auf 1&1 Hardware die spinnt und ich soll den Fehler finden?!

Ich verstehe ja das sie sich vor Kunden schützen müssen die Null Ahnung haben, aber wenn ein neu aufgesetztes System segfaults produziert sollten sie IMHO einen anderen Prozess anstoßen als den Standard-Abwimmel-Prozess. Und ich habe es oft versucht, sehr oft, per Telefon, per Mail.... keine Chance. Das sie nicht fragen ob der Stecker steckt ist alles....

Grüße alle Admins
Michael
Top

danton
Posts: 47
Joined: 2006-01-10 17:45

Re: 1&1-rootserver: relaylock und andere produzieren segfaults

Post by danton »

das sieht mir sehr stark nach einem Hardware-Problem aus. Wenn der Server 'ne Remote-Console hat und du Grub nutzt, dann teste doch mal den Arbeitsspeicher mit Memtest.
Top

oxygen
RSAC
Posts: 2179
Joined: 2002-12-15 00:10
Location: Bergheim

Re: 1&1-rootserver: relaylock und andere produzieren segfaults

Post by oxygen »

Das ist mit ziemlicher Sicherheit kein Hardwarefehler. Vermutlich liegt das Problem bei Plesk. Entweder wurde eine falsche Version installiert oder das Problem liegt bei Plesk selber (z.B. gegen falsche SuSE Version gelinkt)
Top

hifims
Posts: 3
Joined: 2009-04-06 21:08

Re: 1&1-rootserver: relaylock und andere produzieren segfaults

Post by hifims »

Egal ob Hardware oder OS bzw Soft. wie PLESK, beides wird so zur Verfügung gestellt und man sollte Funktion erwarten dürfen.

gleich wird der memtest gemacht....
ich erwarte keine RAM-Fehler, der Support hatte ihn bereits getestet, somit bleibt der Verdacht das das installierte Softwarepacket ein Problem hat.
Das kann aber auch nicht sein oder? denn bei so vielen Servern wäre es doch längst bemerkt worden!
Top

User avatar
Joe User
Project Manager
Project Manager
Posts: 11518
Joined: 2003-02-27 01:00
Location: Hamburg

Re: 1&1-rootserver: relaylock und andere produzieren segfaults

Post by Joe User »

Weitere Möglichkeit: Übergebe dem Kernel mal "noapic", bewirkt auf AMD-Kisten manchmal Wunder...
PayPal.Me/JoeUserFreeBSD Remote Installation
Wings for LifeWings for Life World Run

„If there’s more than one possible outcome of a job or task, and one
of those outcomes will result in disaster or an undesirable consequence,
then somebody will do it that way.“ -- Edward Aloysius Murphy Jr.
Top

hifims
Posts: 3
Joined: 2009-04-06 21:08

Re: 1&1-rootserver: relaylock und andere produzieren segfaults

Post by hifims »

Danke für den Tipp mit noapic ... werde ich bei zeiten mal versuchen. Da derzeit Dringenderes ansteht lasse ich Mail derzeit wieder auf dem alten Suse 9.3 laufen dessen relaylock ohne segfaults arbeitet.

Die Hardware scheidet nun sicher aus, sie haben die Platten in einen anderen rootserver gesteckt.

Kurios finde ich: der relaylock arbeitet 15.000 mal am Tag ohne Fehler (Danke an die Spammer für diesen Massentest ;) )
Erst wenn ich den MX für eine bestimmte Domain auf diesen Server lege gibt es nach 10-20 Stunden die segfaults. Irgend etwas müssen die mailclients dieses Kunden anders machen, evtl. machen sie TLS oder SSL - connects die der alte Server ohne Fehler handelt.

Den rootserversupport versteh ich bei bestem Willen nicht, ich sag nur ignore, ignore ignore, Wochen vergehen bis man etwas bewegt kriegt. Man muß Glück haben an einen Supporter zu geraten der helfen will. Wobei diese Supportqualität wahrscheinlich von oben angeordnet ist.
Das letzte 'highlight' war: Als ich mich über die segfaults von standard-funktionen (mail) beschwerte, es doch nicht sein kann das ich das debuggen soll (ich sollte mich an die Entwickler/Foren wenden) erklärte er mir das segfaults keine aussergewöhnlichen Ereignisse seien. Wie bitte, bin ich im falschen Film oder was? Null segfaults im alten Suse 9.3 logfile seit Jahren, und auch sonst auf keinem Server den ich administriere.

Aktueller Stand ist, sie geben mittlerweile zu, die libsqlite3.so.0.8.6 ist eine von ihnen installierte library, aber helfen könnten sie da nicht.
Diese Haltung zahlt sich auch noch für Sie aus, ich muß den alten Server nochmal um 1 Monat verlängern, weitere 100 € für 1&1...
Top