Page 1 of 1
Spamassassin besser verstehen
Posted: 2004-02-05 02:28
by routeserver
Hallo,
nachdem ich SA eingerichtet habe, laufen eine WebScripts ebenso in den SPAM-Filter rein. Statt mit Whitelists Workarounds zumachen möchte ich lieber die Fehler verstehen.
Gibt es eine Erklärungen zu Fehlermeldungen wie:
HTML_20_30,HTML_MESSAGE,HTTP_WITH_EMAIL_IN_URL,MIME_HTML_O
NLY,MSGID_FROM_MTA_SHORT,NO_REAL_NAME,SUBJ_HAS_UNIQ_ID,SUBJ_ILLEGAL_CHARS
Vielen Dank
Re: Spamassassin besser verstehen
Posted: 2004-02-05 02:44
by dodolin
Gibt es eine Erklärungen zu Fehlermeldungen wie:
Ja.
/usr/share/spamassassin/*
Am besten z.B. sowas machen:
Code: Select all
grep HTML_20_30 /usr/share/spamassassin/*
In Deutsch gibts das ganze bei mir in /usr/share/spamassassin/30_text_de.cf, wobei ich mir aber nicht sicher bin, ob schon alles übersetzt ist. Eventuell gibt es manche Beschreibungen nur in Englisch. Wenn dir die Beschreibungen nicht ausreichen (was bei mir schon manchmal der Fall war...), dann hilft meist nur noch der Blick in den Sourcecode... :)
Re: Spamassassin besser verstehen
Posted: 2004-02-05 20:32
by routeserver
vielen Dank. Das bringt mich schon entscheidend weiter.
Allerdings ist z.b. die Aussage
Nachricht enthält zwischen 20 und 30% HTML
für mich noch nicht ausreichend. Soll es mehr oder weniger werden, warum wird das als SPAM indiziert? Gibt es eine Erklärung, wo das Ideal liegt, oder kann ich das erkennen?
Gruß
Jörg
Re: Spamassassin besser verstehen
Posted: 2004-02-06 11:19
by dodolin
Soll es mehr oder weniger werden, warum wird das als SPAM indiziert? Gibt es eine Erklärung, wo das Ideal liegt, oder kann ich das erkennen?
Auf
http://wiki.spamassassin.org ist beschrieben, wie der GA Prozess zur Scoreberechnung funktioniert. Anhand von riesigen Corpi Spam und Ham wird eben geschaut, welche Regeln mehr für Spam und welche mehr für Ham sprechen. Schau dir die Datei "freqs" in den SA-Sourcen an.
Re: Spamassassin besser verstehen
Posted: 2004-02-08 00:48
by routeserver
danke. Wir konnten die betroffenen Scripte vom Level 11.8 auf 1.72 (oder so ähnlich) runtertreiben. Ein paar Punktabzüge gibt scheinbar immer, wenn man schon ne HTML-Mail mit einem Link macht.