Wie sind denn Eure Erfahrung mit dem Regelset, dem Bayes-Lernmodus, den White- und Blacklists und und .. von SA. Wie habt Ihr Eure local.cf oder/und Eure user_prefs "gestaltet" ?? Bitte um rege Beteiligung. :)
cu AM
Code: Select all
exception {
xfilter "/usr/bin/spamc"
}
if (/^X-Spam-Flag: YES/)
to "$HOME/Maildir/.spam/"
# [... hier diverse Sortiermethoden gesnippt, da IMHO nicht relevant]
to "$HOME/Maildir/"
Dann würde ich sagen, verfolge das, woran es liegt:Nach meiner Beobachtung stuft das Programm nach
längerer Lernphase (hab auch so ein sa-learn-Script ca. 2 Wochen laufen lassen) Mails ( Spam! ) nicht mehr "ordentlich" ein.
Ich habe es auch auf 5 (=Default) belassen. Wenn du obiges analysiert hast, könntest du ja z.B. den Score für bestimmte Regeln anpassen. Ich für mich halte es so, dass ich am required_hits nix drehe, sondern an den einzelnen Scores.Sollte man dann, nach längerem Lernen, den Schwellwert
zurück nehmen?
required_hits = ? ( steht bei mir z.Zt. bei 5 )
Nein. Ich vermute allerdings, dass das mit den deutschen Regeln noch etwas dauern wird, wenn ich mir deren Homepage so durchlese...@dodolin weisst Du wann es ein Update geben soll?
ACK. Mache ich bisher nicht, da ich schon mehr als genug Spam (hauptsächlich usenet-bedingt) auch ohne Spamtraps bekomme.Ich hab auch noch Honeypots aufgestellt, also sinnlose Mailaccounts eingerichtet. Da die nirgends veröffentlicht sind, sind Mails an diese Accounts 100%-ig Spam. Damit kann man dann den Bayes füttern
Hier sollte man extrem vorsichtig sein. Ich würde sogar komplett davon abraten. From: Adressen sind häufig gefälscht und somit landen unschuldige in der Blacklist. Siehe hierzu z.B. diesen aktuellen Thread in danam: http://groups.google.de/groups?q=group: ... ct:Bouncesund/oder zusätzlich die From Adressen rausfiltern und an die Blacklist hängen.
Code: Select all
report_safe 1
required_hits 5.0
rewrite_subject 1
spam_level_stars 1
subject_tag ++SPAM markiert++
report_header 1
skip_rbl_checks 1
check_mx_attempts 2
check_mx_delay 5
bayes_auto_learn 1
use_bayes 1
use_razor2 1
razor_config /root/.razor/razor-agent.conf
auto_whitelist_factor 0.5
bayes_path /root/.spamassassin/bayes
auto_whitelist_path /root/.spamassassin/auto-whitelist
bayes_file_mode 777
auto_whitelist_file_mode 777
auto_learn 1
blacklist_from *@yahoo.co.jp
bayes_auto_learn_threshold_nonspam -3
bayes_auto_learn_threshold_spam 5
bayes_ignore_header ReSent-Date
bayes_ignore_header ReSent-From
bayes_ignore_header ReSent-Message-ID
bayes_ignore_header ReSent-Subject
bayes_ignore_header ReSent-To
bayes_ignore_header Resent-Date
bayes_ignore_header Resent-From
bayes_ignore_header Resent-Message-ID
bayes_ignore_header Resent-Subject
bayes_ignore_header Resent-To
Also dabei wäre mir jetzt äusserst unwohl!bayes_path /root/.spamassassin/bayes
auto_whitelist_path /root/.spamassassin/auto-whitelist
bayes_file_mode 777
auto_whitelist_file_mode 777
Mit größter Wahrscheinlichkeit: Gar nicht.Weiss jemand wie man user_prefs und bayes bei einem "Postfix Virtual Mail User System" mit amavisd-new nutzen kann ?
Die Chancen sehe ich gleich Null. Ich fürchte, du hast meine Erklärungen warum das so ist und nicht geht nicht verstanden. Denn ansonsten sollte dir das IMHO jetzt klar sein, warum das nicht gehen kann und warum das wohl auch in naher und ferner Zukunft nicht gehen wird.vielleicht wirds ja in den nächsten Versionen integriert.
Wegen des 777 ?dodolin wrote:Also dabei wäre mir jetzt äusserst unwohl!bayes_path /root/.spamassassin/bayes
auto_whitelist_path /root/.spamassassin/auto-whitelist
bayes_file_mode 777
auto_whitelist_file_mode 777
Ja, und weil es in /root ist. /root ist bei mir root:root 700. Fertig. Man kann ja nie wissen, was man darin mal später so alles aufbewahren will... Und dass dort normale Nutzer Schreibrechte haben... Zumal /root bei mir auf der / Partition liegt, die keine Quotas aktiviert hat, weil dort kein Nutzer was schreiben kann. Ich würde dazu z.B. lieber was in /var/mail nehmen und das unter einem Mailnutzer (mail, exim, postfix, ...) aufführen lassen. Oder muss da jeder Nutzer auch händisch was reinschreiben können? Dann würde ich mir mal "shared maildirs" anschauen...Wegen des 777 ?
... Und dass dort normale Nutzer Schreibrechte haben...
Nein, ist systemweit und nicht editierbar. Obwohl - und das will ich noch rauskriegen - das gut wär. So ala GMX.Oder muss da jeder Nutzer auch händisch was reinschreiben können?
Ã?hem... wenn es doch aber 777 ist?! Oder wie sehen die Rechte der Verzeichnisse obendrüber aus?Nein, "normale" Nutzer haben da keine Schreibrechte. Ist nur für root
Also ich persönlich finde es ja wesentlich netter, wenn jeder User in user_prefs und ~/.spamassassin/bayes_* seine eigenen Filter und Bayesregeln anlegen kann. Zumal dann Bayes auch um einiges besser funktionieren dürfte, wie systemweit.Nein, ist systemweit und nicht editierbar. Obwohl - und das will ich noch rauskriegen - das gut wär. So ala GMX.
Ja, ich auch. ;) Aber wie? Ich kann nicht das gesamte System, auch nicht mal`n paar Std, lahmlegen, um zu "experimentieren". Da sind etliche User, die ihren Geschäftsverkehr ausschliesslich über Email abwickeln. :)Also ich persönlich finde es ja wesentlich netter, wenn jeder User in user_prefs und ~/.spamassassin/bayes_* seine eigenen Filter und Bayesregeln anlegen kann. Zumal dann Bayes auch um einiges besser funktionieren dürfte, wie systemweit.
Kommt auf den MTA drauf an. Mit Exim müsste man halt an den Transports rumschrauben. Aber am besten wäre es, wenn das jeder User selbst in seiner .procmailrc oder .mailfilter vornimmt. Eine große Downtime sollte sich dadurch nicht ergeben, bzw. du kannst den bisherigen Systemweiten Filter ja erstmal eine Zeit lang weiterlaufen lassen, bis alle Accounts umgestellt sind, dann wird zur Not halt eine Mail doppelt gescannt (hier dann aber Vorsicht mit Bayes, etc.).Aber wie?
Code: Select all
X-Spam-Status: No, hits=-0.4 required=5.0
tests=BAYES_10,DE_GRATIS,FROM_ENDS_IN_NUMS,INVALID_DATE,
RAZOR2_CF_RANGE_91_100,RAZOR2_CHECK
Jetzt wäre es noch interessant zu wissen, wieviele Punkte das jetzt jeweils gab. Weil eigentlich hören sich die Matches eher nach Positiv-Scores an und mich würde mal interessieren, wie dein SA da jetzt auf einen Negativscore kommt.hier nun mal eine meldung (false) von SA bei einer eindeutigen Spam-Mail:
Ja, das heisst es. Trainiert ist aber täglich 2x worden (läuft noch - per Cron). Kann man da was falsch machen beim Training?Hat dein BAYES_10 zuviele Negativpunkte (sehr wahrscheinlich)? Dann vermute ich, du hast ihn einfach noch nicht genug trainiert oder warum schätzt er das nur zu 10% als Spam ein? (Das heißt doch dieser Match, oder?)
Ja. Sogar sehr viel. Hast du http://www.spamassassin.org/doc/sa-learn.html schon alles gelesen?Kann man da was falsch machen beim Training?
Steht alles auf http://www.spamassassin.org/doc/sa-learn.html :)weiss jemand, wie man SA das "gelernte" wieder austreibt? Meins hat offensichtlich was falsches "gelernt".
Code: Select all
BAYES_01 (-5.4 points) BODY: Bayesian classifier says spam probability is 1 to 10%
[score: 0.0342]