server down... warum ?

FreeBSD, Gentoo, openSUSE, CentOS, Ubuntu, Debian
r00ty
Posts: 747
Joined: 2003-03-17 15:32

server down... warum ?

Post by r00ty »

Hallo !
Heute morgen ist mein Server abgesoffen und ich werde nicht wirklich schlau warum. Ich wollte euch ein wenig Teilhaben lassen, vielleicht habt ihr ne Idee.
Also das ganze ging ca. um 06:31 los. Um 13:00 hab ichs enddeckt - da kam ich aber per ssh nicht mehr auf den Server....
Nach nem Reboot läuft er wieder, aber jetzt gehts an die Fehlersuche. Hier ein paar Logs:

/var/log/messages:

Code: Select all

pr  9 06:25:42 myhost ctl_cyrusdb[24576]: archiving log file: /var/lib/imap/db/log.0000000001
Apr  9 06:25:42 myhost ctl_cyrusdb[24576]: done checkpointing cyrus databases
Apr  9 06:25:42 myhost master[1201]: process 24576 exited, status 0
Apr  9 06:27:29 myhost master[25042]: about to exec /usr/lib/cyrus/bin/lmtpd
Apr  9 06:27:29 myhost lmtpunix[25042]: executed
Apr  9 06:27:30 myhost lmtpunix[25042]: accepted connection
Apr  9 06:27:30 myhost lmtpunix[25042]: lmtp connection preauth'd as postman
Apr  9 06:27:30 myhost lmtpunix[25042]: IOERROR: fstating sieve script /var/lib/sieve/w/web2p1/defaultbc: No such file or directory
Apr  9 06:27:30 myhost lmtpunix[25042]: duplicate_check: <bef001c53cb3$871b18e2$f51fda79@01consulting.es> user.web2p1          0
Apr  9 06:27:30 myhost lmtpunix[25042]: mystore: starting txn 2147485791
Apr  9 06:27:30 myhost lmtpunix[25042]: mystore: committing txn 2147485791
Apr  9 06:27:30 myhost lmtpunix[25042]: duplicate_mark: <bef001c53cb3$871b18e2$f51fda79@01consulting.es> user.web2p1          1113020850 7486
Apr  9 06:28:30 myhost master[1201]: process 25042 exited, status 0
Apr  9 06:30:02 myhost /usr/sbin/cron[25715]: (web3) CMD (/home/htdocs/web3/fetchmailrc_cron)
Apr  9 06:31:03 myhost master[26074]: about to exec /usr/lib/cyrus/bin/lmtpd
Apr  9 06:31:05 myhost lmtpunix[26074]: executed
Apr  9 06:31:06 myhost lmtpunix[26074]: accepted connection
Apr  9 06:31:06 myhost lmtpunix[26074]: lmtp connection preauth'd as postman
Apr  9 06:31:07 myhost lmtpunix[26074]: IOERROR: fstating sieve script /var/lib/sieve/w/web3p1/defaultbc: No such file or directory
Apr  9 06:31:07 myhost lmtpunix[26074]: duplicate_check: <20050409043101.EECE080294F@myhost.myhost.com> user.web3p1          0
Apr  9 06:31:07 myhost lmtpunix[26074]: mystore: starting txn 2147485793
Apr  9 06:31:07 myhost lmtpunix[26074]: mystore: committing txn 2147485793
Apr  9 06:31:07 myhost lmtpunix[26074]: duplicate_mark: <20050409043101.EECE080294F@myhost.myhost.com> user.web3p1          1113021067 740
Apr  9 06:32:01 myhost lmtpunix[26074]: accepted connection
Apr  9 06:32:01 myhost lmtpunix[26074]: lmtp connection preauth'd as postman
Apr  9 06:32:01 myhost lmtpunix[26074]: IOERROR: fstating sieve script /var/lib/sieve/w/web3p1/defaultbc: No such file or directory
Apr  9 06:32:01 myhost lmtpunix[26074]: duplicate_check: <20050409043201.6D30580294F@myhost.myhost.com> user.web3p1          0
Apr  9 06:32:01 myhost lmtpunix[26074]: mystore: starting txn 2147485794
Apr  9 06:32:01 myhost lmtpunix[26074]: mystore: committing txn 2147485794
Apr  9 06:32:01 myhost lmtpunix[26074]: duplicate_mark: <20050409043201.6D30580294F@myhost.myhost.com> user.web3p1          1113021121 741
Apr  9 06:33:01 myhost master[1201]: process 26074 exited, status 0
Apr  9 06:33:03 myhost master[26491]: about to exec /usr/lib/cyrus/bin/lmtpd
Apr  9 06:33:03 myhost lmtpunix[26491]: executed
das lmtpunix hab ich dann alle Minute bis ich den Server gebootet habe
/var/log/warn

Code: Select all

Apr  9 04:36:45 myhost avgatefwd[24296]: Alert! the file "/var/spool/avmailgate/incoming/df-24295-7E434ABC" contains "Worm/NetSky.P" worm
Apr  9 04:36:45 myhost avgatefwd[24296]: Alert! the file "/var/spool/avmailgate/incoming/df-24295-7E434ABC" contains "Worm/NetSky.P" worm
Apr  9 04:36:45 myhost avgatefwd[24296]: Potential malicious code has been found - mail will be blocked.
Apr  9 06:39:02 myhost postfix/smtpd[26065]: warning: not enough free space in mail queue: 3927810048 bytes < 1.5*message size limit
Apr  9 06:41:02 myhost postfix/smtpd[26065]: warning: not enough free space in mail queue: 3927744512 bytes < 1.5*message size limit
Apr  9 06:45:03 myhost postfix/smtpd[26065]: warning: not enough free space in mail queue: 3927396352 bytes < 1.5*message size limit
Apr  9 06:52:02 myhost postfix/smtpd[26065]: warning: not enough free space in mail queue: 3927404544 bytes < 1.5*message size limit
Apr  9 07:14:02 myhost postfix/smtpd[30082]: warning: not enough free space in mail queue: 3926986752 bytes < 1.5*message size limit
Apr  9 07:53:03 myhost postfix/smtpd[9216]: warning: not enough free space in mail queue: 3925938176 bytes < 1.5*message size limit
Apr  9 08:30:03 myhost postfix/smtpd[15973]: warning: not enough free space in mail queue: 3924279296 bytes < 1.5*message size limit
Apr  9 08:50:02 myhost postfix/smtpd[15973]: warning: not enough free space in mail queue: 3923550208 bytes < 1.5*message size limit
Apr  9 09:13:03 myhost postfix/smtpd[27012]: warning: not enough free space in mail queue: 3922620416 bytes < 1.5*message size limit
Apr  9 09:28:53 myhost sshd[32292]: fatal: PRNG is not seeded
Apr  9 09:30:05 myhost postfix/smtpd[30386]: warning: not enough free space in mail queue: 3921885560 bytes < 1.5*message size limit
Apr  9 09:30:37 myhost sshd[1388]: fatal: Couldn't obtain random bytes (error 604389476)
Apr  9 09:30:37 myhost sshd[32754]: fatal: PRNG is not seeded
Apr  9 09:52:02 myhost postfix/smtpd[3182]: warning: not enough free space in mail queue: 3920658432 bytes < 1.5*message size limit
.... das geht so weiter

seh ich das richtig ? in meiner Mailqueue ist/war ne 3.9 Gb große Mail ???
Komischer weise läuft aber mein Server schon 5 Minuten früher amok.

die erste Mail an root von meinem Server war die: (Zeit 06:31:02)

Code: Select all

Cron <root@myhost> /root/scripts/srvreport/bin/srvreport.pl
Your random numbers are not that random.
ich hab kein Plan was das ganze soll

Ich bin für jede Idee zu haben. Wäre echt gut rauszufinden was da heute Nacht abging.

kawfy
Posts: 307
Joined: 2002-08-08 23:45

Re: server down... warum ?

Post by kawfy »

(Bsp.: 3920658432 Byte => 3,65 GB)

Die Fehlermeldung ist offensichtlich nicht klar genug: dein Mailer hat nur noch ca. 3,65 GB Platz für Mails -- das ist aber weniger als 1,5 mal der bei dir konfigurierte maximale Größe für Mails. :!: Gegen diesen kritischen Systemzustand wehrt sich dein Mailer. Besser ist das: denn sonst funktioniert der Mailtransport nicht mehr, wenn du große Mails bekommst und sie in der Queue untergebracht werden müssen. Wenn hier gar eine ganze Partition vollläuft, z. B. /var, geht auf einem Server gar nix mehr. :(

Von einer 3,9 GB großen Mail ist im Logs keine Rede.

:arrow: schaffe Platz auf der Partition oder für den User, unter dem der Mailer läuft.

:arrow: überdenke dein Messagelimit. Es ist sinnarm, ein Limit zu benutzen, dass von den anderen, großen Providern lange nicht geboten wird (T-Online: 32 MB, AOL: ?, GMX: 50 MB?, 1&1: 20 MB). Keiner der Kunden dieser Provider könnte dir so große Mails zuschicken, die du großzügigerweise akzeptiert.

:!: Es sei denn, du brauchst das große Limit für User mit speziellen Anforderungen. Da seinen z. B. Architekten oder Werbeleute gemeint, die ihre Daten (Pläne, Druckvorstufen) immer schön per Mail verschicken. Die Daten können dabei sehr groß werden. Von FTP oder WebDAV wollen die aber nix hören. :x

r00ty
Posts: 747
Joined: 2003-03-17 15:32

Re: server down... warum ?

Post by r00ty »

hmmm, also die Idee ist gut (doch die Welt noch nicht bereit ;-))
nein, Danke erstmal für den Hinweis...
Allerdings scheint es nicht ganz richtig zu sein:
mein message_size_limit bei Postfix steht auf 20MB, daran kann es eigentlich nicht liegen.
Die Partitionierung der Platten habe auch nicht ich verbrochen, das ist 1&1 Standart.

aber ich blicks immer noch nicht was die Fehlermeldung soll :(

kawfy
Posts: 307
Joined: 2002-08-08 23:45

Re: server down... warum ?

Post by kawfy »

schade :( -- komisch :)