Page 1 of 1
Ã?ffentliche Spam-Sammlung
Posted: 2004-05-04 16:11
by markuswerner
Hallo,
ich benutze auf meinem Server Spamassassin und möchte dieser Software mit dem Befehl sa-learn "beibringen", was Spam ist. Dazu gibt man sa-learn ein Verzeichniss voller eMails und sagt ihm, dass dies alles Spam ist.
Meine Frage: Kennt jemand eine öffentliche Sammlung von Spammails, die man sich als gepackte Datei herunterladen kann ?
Gruss,
Markus
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-04 19:40
by Joe User
Deine und meine Definition von Spam sind garantiert verschieden, also warum sollte es soetwas geben?
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 00:56
by dodolin
Gibt es, macht aber keinen Sinn. Lies dir die manpage zu sa-learn durch, die Doku im SA-Wiki und die Bayes-Seiten von Paul Graham. Ich hoffe, dann weißt du, warum es keinen Sinn macht.
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 09:28
by markuswerner
Warum sollte es keinen Sinn machen ? Ob die Mails, aus denen die Software lernt über meinen Server kommen, oder manuell gefiltert werden, sollte technisch keine Rolle spielen. Sind doch nicht bei "Wer wird Millionär", "ich weiss die Antwort, aber ich sage sie nicht"..
@joe: Garantiert. Tolle Antwort.
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 12:01
by Joe User
Du scheinst die Problematik Deines Vorhabens (noch) nicht begreifen zu wollen. Lies die von dodolin genannten Quellen und denke anschliessend nochmals über meinen Einwand nach.
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 12:40
by dodolin
Sind doch nicht bei "Wer wird Millionär", "ich weiss die Antwort, aber ich sage sie nicht"..
Du hast da was noch nicht kapiert. Wir sind hier nicht zum wiederkäuen von Wissen. Ich habe dir die Quellen genannt, wo Antworten stehen und es macht keinen Sinn, das hier nochmals abzutippen, wenn es anderswo schon besser und ausführlicher erklärt ist.
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 15:35
by markuswerner
Aloa,
ich habe nun folgende Seiten gelesen:
http://wiki.apache.org/spamassassin/BayesInSpamAssassin
http://www.paulgraham.com/better.html
Wahrscheinlich bin ich zu blind, aber ich kann keine Einwände finden. Vielleicht versuche ich es mit dem Publikumsjoker. Wenn Euch dieser Thread geistig unterfordert, dann antwortet einfach nicht, niemand erwartet das von Euch.
Habe mich jedenfalls mit einigen befreundeten Admins kurzgeschlossen und die arbeiten genau nach dem Schema. Spam in einen Order filtern, sa-learn drüberlaufen lassen. Auszug aus Wiki:
"To train Spamassassin, you get a mailbox full of messages that you know are spam and use the sa-learn program to pull out the tokens and remember them for later:
sa-learn --showdots --mbox --spam spam-file"
Ausgangsfrage war: Wo bekomme ich Tonnen von Spam her ?
Gruss,
Markus
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 16:04
by compositiv
Aus Deinem Postfach? Wenn da noch nicht genug sind, könntest Du Deine EMailadresse auf eine bekannte Webseite bringen %)
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 16:47
by crocodoc
Hi,
ich denke es geht markuswerner nicht darum einen genau auf ihn zugeschnittenen Bayes-Filter zu bekommen, sondern die ganz gewöhnlichen Spammails ala "Enlarge youre penis" oder "Bye Viagra online" in den Filter zu bekommen. Und dies geht eben am besten über Tausende von diesen Mails.
Und wenn man, aus welchen Gründen auch immer, nicht alzu viele davon hat, hat man ein Problem. Dann heist es eben warten bis genug da sind oder sich eben Spam "besorgen".
Und da mir meine Platte schon mal abgeschmiert ist und ich danach verzweifelt versucht habe spamassassin schnell ohne alzu viel eigenen "vorrätigen" Spam auf eine anständige quote zu bekommen kann ich das irgendwie nachvolziehen...
Ich hoffe ich hab Dich da richtig verstanden markuswerner :?: :!:
Wenn da noch nicht genug sind, könntest Du Deine EMailadresse auf eine bekannte Webseite bringen %)
Ich weiss jetzt nicht ob das sooo eine sinnvolle antwort ist?
...man liest sich,
Carsten
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 21:11
by charlie
HI,
also ich arbeit auch mit dem sa-learn von Spamassassin und bin im großen und ganzen sehr zufrieden. Zwei mal Spams eingelesen und er kennt alles was so anfällt. Noch die Autowhiteliste einschalten und man ist für das nächste halbe Jahr geschützt.
Wenn du Spams haben willst ich habe noch ein paar tauschend auf dem Server liegen, dem Ham musst dir allerdings selber zusammenstellen.
Charlie
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-05 22:03
by deacon frost
auf irgendwelchen thebat-Seiten gibts Spam-Mails als Archiv zum Download. Würde mal die bekanntesten durchstöbern
Re: Ã?ffentliche Spam-Sammlung
Posted: 2004-05-06 10:21
by markuswerner
@crocodoc: Danke, genau so meine ich das. Ich möchte den gröbsten Quatsch erstmal filtern und dann kann ich immer noch Feintuning für meine speziellen Bedürfnisse betreiben.
@charlie: Ham habe ich, wie gesagt, Tonnen von Spam will ich. Bitte, gebt mir Spam!! ;-)
@Deacon Frost: In einem anderen Forum hat mir jemand den selben Tip gegeben. Ich gucke mal nach:
"Ich meine auf http://www.batworld.de gab es so eine Sammlung. Allerdings ist die Seite derzeit offenbar nicht erreichbar..."
Gruss,
Markus