Spamassassin besser verstehen

Postfix, QMail, Sendmail, Dovecot, Cyrus, Courier, Anti-Spam
routeserver
Posts: 25
Joined: 2003-12-02 02:11

Spamassassin besser verstehen

Post by routeserver » 2004-02-05 02:28

Hallo,

nachdem ich SA eingerichtet habe, laufen eine WebScripts ebenso in den SPAM-Filter rein. Statt mit Whitelists Workarounds zumachen möchte ich lieber die Fehler verstehen.

Gibt es eine Erklärungen zu Fehlermeldungen wie:
HTML_20_30,HTML_MESSAGE,HTTP_WITH_EMAIL_IN_URL,MIME_HTML_O
NLY,MSGID_FROM_MTA_SHORT,NO_REAL_NAME,SUBJ_HAS_UNIQ_ID,SUBJ_ILLEGAL_CHARS

Vielen Dank

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: Spamassassin besser verstehen

Post by dodolin » 2004-02-05 02:44

Gibt es eine Erklärungen zu Fehlermeldungen wie:
Ja.
/usr/share/spamassassin/*

Am besten z.B. sowas machen:

Code: Select all

grep HTML_20_30 /usr/share/spamassassin/*
In Deutsch gibts das ganze bei mir in /usr/share/spamassassin/30_text_de.cf, wobei ich mir aber nicht sicher bin, ob schon alles übersetzt ist. Eventuell gibt es manche Beschreibungen nur in Englisch. Wenn dir die Beschreibungen nicht ausreichen (was bei mir schon manchmal der Fall war...), dann hilft meist nur noch der Blick in den Sourcecode... :)

routeserver
Posts: 25
Joined: 2003-12-02 02:11

Re: Spamassassin besser verstehen

Post by routeserver » 2004-02-05 20:32

vielen Dank. Das bringt mich schon entscheidend weiter.

Allerdings ist z.b. die Aussage
Nachricht enthält zwischen 20 und 30% HTML

für mich noch nicht ausreichend. Soll es mehr oder weniger werden, warum wird das als SPAM indiziert? Gibt es eine Erklärung, wo das Ideal liegt, oder kann ich das erkennen?

Gruß

Jörg

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: Spamassassin besser verstehen

Post by dodolin » 2004-02-06 11:19

Soll es mehr oder weniger werden, warum wird das als SPAM indiziert? Gibt es eine Erklärung, wo das Ideal liegt, oder kann ich das erkennen?
Auf http://wiki.spamassassin.org ist beschrieben, wie der GA Prozess zur Scoreberechnung funktioniert. Anhand von riesigen Corpi Spam und Ham wird eben geschaut, welche Regeln mehr für Spam und welche mehr für Ham sprechen. Schau dir die Datei "freqs" in den SA-Sourcen an.

routeserver
Posts: 25
Joined: 2003-12-02 02:11

Re: Spamassassin besser verstehen

Post by routeserver » 2004-02-08 00:48

danke. Wir konnten die betroffenen Scripte vom Level 11.8 auf 1.72 (oder so ähnlich) runtertreiben. Ein paar Punktabzüge gibt scheinbar immer, wenn man schon ne HTML-Mail mit einem Link macht.