sa-learn hat vergesslich gemacht :(

Postfix, QMail, Sendmail, Dovecot, Cyrus, Courier, Anti-Spam
aubergine
Posts: 471
Joined: 2005-09-10 17:52
Location: Frankfurt am Main
 

sa-learn hat vergesslich gemacht :(

Post by aubergine »

Hi,

wir betreiben einen Mailserver auf dem spamassasins als Anti-spam Software eingesetzt wird.

Es lief mit der default Datenbank von sa auch recht gut und Erkennungsrate lag bei etwa 98%.

Da wir nach 2 Jahren des vollgespammt werdens einen Spamordner mit ca. 40.000 Spam Mails hatten haben wir beschlossen unseren sa Mittels sa-learn noch etwas zu verbessern.

Nur leider ging die Massnahme kräftig nach hinten los..

Fazit: Nun liegt die Spam Erkennungsrate bei nurnoch 90% was ziemlich nervige folgen hat.


Da die anderen beiden Admins zur Zeit durch Norwegen irren und ich als einziger im warmen Deutschland zurück geblieben bin, aber von E-Mail Servern
und spamassasins keine Ahnung habe, wollte ich euch mal fragen wie ich den spam Filter am Besten - und simpelsten - wieder auf hochtouren bringe.


Dankeschön und schönen 1. Weihnachtsfeiertag


~aubergine
aubergine
Posts: 471
Joined: 2005-09-10 17:52
Location: Frankfurt am Main
 

Re: sa-learn hat vergesslich gemacht :(

Post by aubergine »

Ok hab den spamassasin nochmal neu angelernt und bayes erstellen lassen.
Mal sehen ob es nun besser läuft.
aubergine
Posts: 471
Joined: 2005-09-10 17:52
Location: Frankfurt am Main
 

Re: sa-learn hat vergesslich gemacht :(

Post by aubergine »

Ich hab nun folgendes getan:

Code: Select all

sa-learn --spam /ordner/zum/spam
sa-learn --sync
sa-learn --spam --mbox /ordner/zum/mbox
sa-learn --sync
Der Spam Ordner der ersten Zeile umfasst ca. 2000 Einträge.

Die mbox Linux Files hab ich hier heruntergelanden und ebenfalls beide rein geladen:
http://www.thebatworld.de/modules/downl ... ink&cid=10

Die local.cf sieht so aus:

Code: Select all

auto_learn 1
use_bayes 1
bayes_path /etc/spamassassin/bayes
bayes_file_mode 777

Ich habe vor dem anlernen die bayes gelöscht um zu verfolgen was passiert. Er hat durch die sa-learn aktionen auch eine mittlerweile 6MB große bayes_toks angelegt.


Nichts desto trotz sind die ersten 3 Spammails des Tages wieder nicht gefilter worden...

Weis jemand um Rat :?:
static
Posts: 437
Joined: 2002-10-27 19:56
Location: Schweiz
 

Re: sa-learn hat vergesslich gemacht :(

Post by static »

Hi
Zuerst muss ich gleich sagen, das ich mich mit Spamassassin nicht sehr ausgiebig beschäftige, ich kann mich also auch sehr gut irren...

Als du sa-learn die Spammails gefüttert hast, wurden da auch ham Mails gelernt? Wenn nicht könnte das zu deinem Problem führen. Soweit ich mich erinnern kann, braucht der Bayes Filter sowohl genügend Spam als auch Ham Mails um richtig zu funktionieren. Ansonsten kannst du ja mal die detaillierten Logs zu einer Message posten, um zu sehen was Spamassassin genau macht.

.static
aubergine
Posts: 471
Joined: 2005-09-10 17:52
Location: Frankfurt am Main
 

Re: sa-learn hat vergesslich gemacht :(

Post by aubergine »

static wrote: Ansonsten kannst du ja mal die detaillierten Logs zu einer Message posten, um zu sehen was Spamassassin genau macht.
Jo nix das ist ja das Problem.
Logs gibt es nicht ausser die vom Mailserver und die sind unspektakulär.

So wie ich das verstanden habe is ham genau das Gegenteil zu Spam. Also Messages die definitiv durchkommen sollen. Was ja bei mir leider fast immer der Fall ist.

So sieht das aus wenn er spam findet:

Code: Select all

Dec 25 10:51:38 MailScanner[2238]: Spam Checks: Starting
Dec 25 10:51:39 postfix/smtpd[6077]: disconnect from unknown[219.x.x.x]
Dec 25 10:51:41 MailScanner[1207]: Message 86CDD2D2DD4.DD833 from 62.194.221.224 (ironic@woodlyn.net) to domain.de is spam, SpamAssassin (Wertung=5.464, benoetigt 3, EXTRA_MPART_TYPE 0.22, HTML_50_60 0.10, HTML_IMAGE_ONLY_20 0.84, HTML_MESSAGE 0.00, RCVD_IN_NJABL_DUL 1.66, RCVD_IN_SORBS_DUL 0.14, RCVD_IN_XBL 2.51)
timeless2
Posts: 415
Joined: 2005-03-04 14:45
Location: Paris
 

Re: sa-learn hat vergesslich gemacht :(

Post by timeless2 »

Du musst den Spamassassin mit mindestens 200 Ham-Mails anlernen. Es ist zu Beginn ratsam, die Einstellungen bzw. Filterergebnisse zu überprüfen und den Spamassassin nachzulernen. D.h. mit den Spam-Mails die trotzdem durchkommen aber auch mit regulären E-Mails, die bepunktet wurden.

Noch etwas aus der SA-Doku:
Check your local.cf syntax by typing:

spamassassin --lint

From the command line, you can make sure spamassassin works by trying:

spamassassin -D < /usr/share/spamassassin/doc/spamassassin-3.0.3/sample-spam.txt
aubergine
Posts: 471
Joined: 2005-09-10 17:52
Location: Frankfurt am Main
 

Re: sa-learn hat vergesslich gemacht :(

Post by aubergine »

Danke euch beiden, funktioniert jetzt wieder einwandfrei :)