Bayes scheint nicht zu scannen

Postfix, QMail, Sendmail, Dovecot, Cyrus, Courier, Anti-Spam
ponchofiesta
Posts: 48
Joined: 2005-12-07 12:25
Location: Luckau
 

Bayes scheint nicht zu scannen

Post by ponchofiesta »

Hallo Leute,

ich wollte meinen Spamassassin jetzt noch ein bisschen durch eine Bayes DB verbessern.

Meine local.cf sieht diesbezüglich so aus:

Code: Select all

use_bayes 1
bayes_path /etc/mail/spamassassin/bayes
bayes_auto_expire 0
bayes_journal_max_size 15000000
bayes_expiry_max_db_size 20000000
bayes_auto_learn 0
Wenn ich nun eine Test anschubse, sieht auch alles OK aus:

Code: Select all

# spamassassin -D --lint
[32674] dbg: logger: adding facilities: all
[32674] dbg: logger: logging level is DBG
[32674] dbg: generic: SpamAssassin version 3.1.7-deb
[32674] dbg: config: score set 0 chosen.
...
[32674] dbg: config: read file /etc/spamassassin/local.cf
...
[32674] dbg: bayes: tie-ing to DB file R/O /etc/mail/spamassassin/bayes_toks
[32674] dbg: bayes: tie-ing to DB file R/O /etc/mail/spamassassin/bayes_seen
[32674] dbg: bayes: found bayes db version 3
[32674] dbg: bayes: DB journal sync: last sync: 1180072650
...
[32674] dbg: bayes: DB journal sync: last sync: 1180072650
[32674] dbg: bayes: corpus size: nspam = 545, nham = 289
[32674] dbg: bayes: score = 0.939889350451552
[32674] dbg: bayes: DB journal sync: last sync: 1180072650
[32674] dbg: bayes: untie-ing
[32674] dbg: bayes: untie-ing db_toks
[32674] dbg: bayes: untie-ing db_seen
[32674] dbg: rules: ran eval rule BAYES_80 ======> got hit
[32674] dbg: rules: running raw-body-text per-line regexp tests; score so far=1.999
[32674] dbg: rules: running full-text regexp tests; score so far=1.999
...
[32674] dbg: rules: running header regexp tests; score so far=4.156
[32674] dbg: rules: running body-text per-line regexp tests; score so far=4.156
[32674] dbg: uri: running uri tests; score so far=4.156
[32674] dbg: rules: running raw-body-text per-line regexp tests; score so far=4.156
[32674] dbg: rules: running full-text regexp tests; score so far=4.156
[32674] dbg: check: running tests for priority: 1000
[32674] dbg: rules: running meta tests; score so far=4.156
[32674] dbg: rules: running header regexp tests; score so far=4.156
[32674] dbg: rules: running body-text per-line regexp tests; score so far=4.156
[32674] dbg: uri: running uri tests; score so far=4.156
[32674] dbg: rules: running raw-body-text per-line regexp tests; score so far=4.156
[32674] dbg: rules: running full-text regexp tests; score so far=4.156
[32674] dbg: check: is spam? score=4.156 required=5
[32674] dbg: check: tests=BAYES_80,MISSING_SUBJECT,NO_RECEIVED,NO_RELAYS,TO_CC_NONE
[32674] dbg: check: subtests=__HAS_MSGID,__MSGID_OK_DIGITS,__MSGID_OK_HOST,__NONEMPTY_BODY,__SANE_MSGID,__UNUSABLE_MSGID
Wie man sieht, hat Bayes die Testmail erfolgreich als Spam identifiziert und BAYES_80 gesetzt (so deute ich das mal).

Momentan tauchen aber in keinen Mails irgendwelche Bayes-Scores in den SA-Reports auf.
Woran kann das liegen? Was mache ich falsch?


EDIT:
Ich hab jetzt noch ein paar Tests gemacht.

Mal eine Spammail als Beispiel...
Nach dem Empfang hat die die Mail diesen SA-Report:

Code: Select all

	Inhaltsanalyse im Detail:   (2.3 Punkte, 5.0 benötigt)
	Pkte Regelname              Beschreibung
	---- ---------------------- --------------------------------------------------
	2.3 DATE_IN_FUTURE_12_24   Absendezeit 12 bis 24 Stunden nach Datum in
Aber wenn ich die selbe Mail dann per "spamc -R < spammail.txt" scanne, bekomme ich diesen report:

Code: Select all

Inhaltsanalyse im Detail:   (10.2 Punkte, 5.0 benötigt)

Pkte Regelname              Beschreibung
---- ---------------------- --------------------------------------------------
 2.8 DATE_IN_FUTURE_12_24   Absendezeit 12 bis 24 Stunden nach Datum in
                            "Received"-Kopfzeilen
 3.5 BAYES_99               BODY: Spamwahrscheinlichkeit nach Bayes-Test: 99-100%
                            [score: 1.0000]
 3.9 RCVD_IN_XBL            RBL: Transportiert via Rechner in XBL-Liste
                            (http://www.spamhaus.org/xbl/)
                            [221.199.140.208 listed in sbl-xbl.spamhaus.org]
Per Hand scheint er mehr zu machen als wenn es durch den Exim läuft!?
Was läuft da nur falsch?

EDIT:
Noch eine:
Im Mail-Client:

Code: Select all

2.9 RATWARE_RCVD_PF        Gefälschte "Received"-Kopfzeile von Postfix
0.8 EXTRA_MPART_TYPE       Unnötige Parameter in "Content-Type"-Kopfzeile
("...type=")
4.0 HTML_IMAGE_ONLY_12     BODY: Außer Bildern nur 800-1200 Zeichen Text
0.0 HTML_MESSAGE           BODY: Nachricht enthält HTML
Auf der Konsole mit spamc:

Code: Select all

 3.6 RATWARE_RCVD_PF        Gefälschte "Received"-Kopfzeile von Postfix
 1.1 EXTRA_MPART_TYPE       Unnötige Parameter in "Content-Type"-Kopfzeile
                            ("...type=")
 4.0 HTML_IMAGE_ONLY_12     BODY: Außer Bildern nur 800-1200 Zeichen Text
 0.0 HTML_MESSAGE           BODY: Nachricht enthält HTML
 3.5 BAYES_99               BODY: Spamwahrscheinlichkeit nach Bayes-Test: 99-100%
                            [score: 1.0000]
Der gibt auch ganz andre Punkte für die selbe Regel. Wie kann das denn sein?
dodolin
Posts: 3840
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe
 

Re: Bayes scheint nicht zu scannen

Post by dodolin »

Per Hand scheint er mehr zu machen als wenn es durch den Exim läuft!?
Was läuft da nur falsch?
Mit welchem User ruft Exim den SA auf?
bayes_path /etc/mail/spamassassin/bayes
Bist du sicher, dass der User, den Exim für SA verwendet, in diesem Verzeichnis lesen UND schreiben (!) kann?! Ich glaube, eher nicht. Bzw. wenn doch, wäre das ziemlich übel. ;)
ponchofiesta
Posts: 48
Joined: 2005-12-07 12:25
Location: Luckau
 

Re: Bayes scheint nicht zu scannen

Post by ponchofiesta »

Oh, das Thema hatte ich ganz vergessen.

Es lag an fehlenden Berechtigungen auf die Bayes-Dateien.
Und die unterschiedlichen Punkte sind auch normal.
ansgar berhorn
Posts: 7
Joined: 2007-05-24 14:13
 

Re: Bayes scheint nicht zu scannen

Post by ansgar berhorn »

ponchofiesta wrote:Hallo Leute,

ich wollte meinen Spamassassin jetzt noch ein bisschen durch eine Bayes DB verbessern.

Meine local.cf sieht diesbezüglich so aus:

Code: Select all

use_bayes 1
bayes_path /etc/mail/spamassassin/bayes
bayes_auto_expire 0
bayes_journal_max_size 15000000
bayes_expiry_max_db_size 20000000
bayes_auto_learn 0
Also die Einstellung sind meines Erachtens eher kontraproduktiv.
Ob der Bayes-Filter eine systemweite DB nutzt oder eine pro User macht für die Laufzeit keinen Unterschied.
Und wenn es pro User läuft, hilft auto_learn dabei, sehr gute (scharfe) Ergebnisse zu erzielen.
ponchofiesta wrote: Der gibt auch ganz andre Punkte für die selbe Regel. Wie kann das denn sein?
Vermutlich überschreiben die user_prefs des Mail-Users da einige Regeln.
Und wenn das zutrifft, wird eine Bayes-DB für den Mail-User verwendet, die noch nicht die nötigen 200 Emails gesehen hat.
ponchofiesta
Posts: 48
Joined: 2005-12-07 12:25
Location: Luckau
 

Re: Bayes scheint nicht zu scannen

Post by ponchofiesta »

Wieso soll das kontraproduktiv sein?

Das mit den verschiedenen Punkten hat einen anderen Grund.