spamassassin bayes-test anzeigen ?

Postfix, QMail, Sendmail, Dovecot, Cyrus, Courier, Anti-Spam
dimaki
Posts: 66
Joined: 2002-11-07 14:45

spamassassin bayes-test anzeigen ?

Post by dimaki » 2004-08-04 10:10

Hallo zusammen,

hab hier ein kleines Problem mit dem Bayes in Spamassassin.
Anscheinend hab ich in meiner Bayes DB irgendwo einen Test drin, der "saubere" Mails als Spam deklariert.
Nur wie kann ich diesen Test anzeigen lassen?

Ich nutze Spamassassin 2.63 mit folgenden Einstellungen:

Code: Select all

require_hits 5
report_safe 0
rewrite_subject 0

add_header all Status _YESNO_, hits=_HITS_ required=_REQD_ tests=_TESTS_ autolearn=_AUTOLEARN_ version=_VERSION_
add_header all Level _STARS(*)_
add_header all Checker-Version SpamAssassin _VERSION_ (_SUBVERSION_) on _HOSTNAME_

# systemwide bayes DB
bayes_path /www/vpopmail/.spamassassin/bayes
Wenn ich jetzt ich jetzt eine "saubere" Mail an spamc zum test übergebe, wird diese wegen bayes als Spam erkannt.

Code: Select all

# spamc < testmail.eml
Return-Path: dimaki@gmx.de
Date: Wed, 28 Mar 2004 12:37:20 +1200
Subject: a nice message with no reason to be spam
From: "dimaki" <dimaki@gmx.de>
To: xzydsdhs@users.sourceforge.net
Message-ID: <00m94g5gf2f73f9b@users.sourceforge.net>
X-Spam-Flag: YES
X-Spam-Checker-Version: SpamAssassin 2.63 (2004-01-11) on serverdomain.de
X-Spam-Level: *****
X-Spam-Status: Yes, hits=5.4 required=5.0 tests=BAYES_99 autolearn=no
        version=2.63
X-Spam-Report:
        *  5.4 BAYES_99 BODY: Spamwahrscheinlichkeit nach Bayes-Test: 99-100%
        *      [score: 0.9998]

This is a simple e-mail about not much at all.


It should get through any underlying AS system as it is fairly inoffensive.

Schalte ich Bayes ab, funktioniert alles einwandfrei.

Wie bekomme ich jetzt raus, welcher bayes-Test dafür verantwortlich ist, bzw. an was es liegt, dass die Mail als Spam erkannt wird?
BAYES_99 hilft mir nicht wirklich weiter.

Danke!

dimaki

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: spamassassin bayes-test anzeigen ?

Post by dodolin » 2004-08-04 10:48

man sa-learn, speziell --dump, siehe auch hier: http://spamassassin.apache.org/doc/sa-learn.html

Hast du bisher schon viele englischsprachige Mails als Ham gelernt?

dimaki
Posts: 66
Joined: 2002-11-07 14:45

Re: spamassassin bayes-test anzeigen ?

Post by dimaki » 2004-08-04 11:25

Das weiß ich schon, aber das bringt mir nix.
Da bekomm ich nicht raus welcher Test BAYES_99 ist und was der tut. Da seh ich nur die Token.

Nein, bisher hab ich nicht viele englischsprachige Mails als Ham gelernt, aber das ist bei den deutschsprachigen kaum anders (Score=4,4) und da hab ich schon einige drin.

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: spamassassin bayes-test anzeigen ?

Post by dodolin » 2004-08-04 11:34

Oh, und ich dachte, über die Basics wären wir schon hinaus?!

Code: Select all

dominik@trinity:~$ cd /usr/share/spamassassin/
dominik@trinity:/usr/share/spamassassin$ grep BAYES_99 *
10_misc.cf:#X-Spam-Status: Yes, hits=14.0 required=5.0 tests=BAYES_99,CALL_FREE
23_bayes.cf:body BAYES_99           eval:check_bayes('0.99', '1.00')
23_bayes.cf:tflags BAYES_99         learn
23_bayes.cf:describe BAYES_99   Bayesian spam probability is 99 to 100%
30_text_de.cf:lang de describe BAYES_99 Spamwahrscheinlichkeit nach Bayes-Test: 99-100%
30_text_fr.cf:lang fr describe BAYES_99 L'algorithme Bayésien a évalué la probabilité de spam entre 99 et 100%
30_text_sk.cf:lang sk describe BAYES_99 Bayesová klasifikácia udáva pravdepodobnos» spamu od 99 do 100%
50_scores.cf:score BAYES_99 0 0 5.400 5.400
Bissi Eigeninitiative schadet nicht...

Edit: Außerdem habe ich den Verdacht, dass du irgendwie "falsch lernst". Guck mal hier: http://spamassassin.apache.org/doc/sa-l ... e_training und den Rest auf der ganzen Seite.

dimaki
Posts: 66
Joined: 2002-11-07 14:45

Re: spamassassin bayes-test anzeigen ?

Post by dimaki » 2004-08-04 12:01

OK, wir haben wohl etwas aneinander vorbeigeredet:

Ich wollte eigentlich nur wissen, wie ich anzeigen kann, welche Token angeschlagen haben so dass der Score 0.9998 resultiert.
Dass alle Token über sa-learn -dump auszugeben sind ist klar.
Und dass bei einem Score von 0.9998 der Test BAYES_99 zuschlägt ist eigentlich auch klar.

Ich suchte eine Option auszugeben, wie SA auf den Score von 0.9998 kommt.
Klar kann ich hergehen und jedes Wort der Mail durch sa-learn --dump data | grep xyz in der Token DB nachschlagen.

Aber gibt es für die vollständige Ausgabe aller gefundenen Token und deren Werte keine andere Möglichkeit?

Ich denke ich lern schon richtig. Nachdem ich SA die Testmail gelernt hab, bringt er einen Score von -4.8.

Trotzdem danke!

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: spamassassin bayes-test anzeigen ?

Post by dodolin » 2004-08-04 15:20

Aber gibt es für die vollständige Ausgabe aller gefundenen Token und deren Werte keine andere Möglichkeit?
AFAIK nein.