Ã?ffentliche Spam-Sammlung

Postfix, QMail, Sendmail, Dovecot, Cyrus, Courier, Anti-Spam
markuswerner
Posts: 7
Joined: 2004-01-24 14:14

Ã?ffentliche Spam-Sammlung

Post by markuswerner » 2004-05-04 16:11

Hallo,

ich benutze auf meinem Server Spamassassin und möchte dieser Software mit dem Befehl sa-learn "beibringen", was Spam ist. Dazu gibt man sa-learn ein Verzeichniss voller eMails und sagt ihm, dass dies alles Spam ist.

Meine Frage: Kennt jemand eine öffentliche Sammlung von Spammails, die man sich als gepackte Datei herunterladen kann ?

Gruss,
Markus

User avatar
Joe User
Project Manager
Project Manager
Posts: 11583
Joined: 2003-02-27 01:00
Location: Hamburg

Re: Ã?ffentliche Spam-Sammlung

Post by Joe User » 2004-05-04 19:40

Deine und meine Definition von Spam sind garantiert verschieden, also warum sollte es soetwas geben?
PayPal.Me/JoeUserFreeBSD Remote Installation
Wings for LifeWings for Life World Run

„If there’s more than one possible outcome of a job or task, and one
of those outcomes will result in disaster or an undesirable consequence,
then somebody will do it that way.“ -- Edward Aloysius Murphy Jr.

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: Ã?ffentliche Spam-Sammlung

Post by dodolin » 2004-05-05 00:56

Gibt es, macht aber keinen Sinn. Lies dir die manpage zu sa-learn durch, die Doku im SA-Wiki und die Bayes-Seiten von Paul Graham. Ich hoffe, dann weißt du, warum es keinen Sinn macht.

markuswerner
Posts: 7
Joined: 2004-01-24 14:14

Re: Ã?ffentliche Spam-Sammlung

Post by markuswerner » 2004-05-05 09:28

Warum sollte es keinen Sinn machen ? Ob die Mails, aus denen die Software lernt über meinen Server kommen, oder manuell gefiltert werden, sollte technisch keine Rolle spielen. Sind doch nicht bei "Wer wird Millionär", "ich weiss die Antwort, aber ich sage sie nicht"..

@joe: Garantiert. Tolle Antwort.

User avatar
Joe User
Project Manager
Project Manager
Posts: 11583
Joined: 2003-02-27 01:00
Location: Hamburg

Re: Ã?ffentliche Spam-Sammlung

Post by Joe User » 2004-05-05 12:01

Du scheinst die Problematik Deines Vorhabens (noch) nicht begreifen zu wollen. Lies die von dodolin genannten Quellen und denke anschliessend nochmals über meinen Einwand nach.
PayPal.Me/JoeUserFreeBSD Remote Installation
Wings for LifeWings for Life World Run

„If there’s more than one possible outcome of a job or task, and one
of those outcomes will result in disaster or an undesirable consequence,
then somebody will do it that way.“ -- Edward Aloysius Murphy Jr.

dodolin
RSAC
Posts: 4009
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: Ã?ffentliche Spam-Sammlung

Post by dodolin » 2004-05-05 12:40

Sind doch nicht bei "Wer wird Millionär", "ich weiss die Antwort, aber ich sage sie nicht"..
Du hast da was noch nicht kapiert. Wir sind hier nicht zum wiederkäuen von Wissen. Ich habe dir die Quellen genannt, wo Antworten stehen und es macht keinen Sinn, das hier nochmals abzutippen, wenn es anderswo schon besser und ausführlicher erklärt ist.

markuswerner
Posts: 7
Joined: 2004-01-24 14:14

Re: Ã?ffentliche Spam-Sammlung

Post by markuswerner » 2004-05-05 15:35

Aloa,

ich habe nun folgende Seiten gelesen:

http://wiki.apache.org/spamassassin/BayesInSpamAssassin
http://www.paulgraham.com/better.html

Wahrscheinlich bin ich zu blind, aber ich kann keine Einwände finden. Vielleicht versuche ich es mit dem Publikumsjoker. Wenn Euch dieser Thread geistig unterfordert, dann antwortet einfach nicht, niemand erwartet das von Euch.

Habe mich jedenfalls mit einigen befreundeten Admins kurzgeschlossen und die arbeiten genau nach dem Schema. Spam in einen Order filtern, sa-learn drüberlaufen lassen. Auszug aus Wiki:

"To train Spamassassin, you get a mailbox full of messages that you know are spam and use the sa-learn program to pull out the tokens and remember them for later:
sa-learn --showdots --mbox --spam spam-file"

Ausgangsfrage war: Wo bekomme ich Tonnen von Spam her ?

Gruss,
Markus

compositiv
Posts: 193
Joined: 2003-01-22 14:58
Location: Hamburg

Re: Ã?ffentliche Spam-Sammlung

Post by compositiv » 2004-05-05 16:04

Aus Deinem Postfach? Wenn da noch nicht genug sind, könntest Du Deine EMailadresse auf eine bekannte Webseite bringen %)

crocodoc
RSAC
Posts: 30
Joined: 2002-10-07 14:29
Location: Rehau

Re: Ã?ffentliche Spam-Sammlung

Post by crocodoc » 2004-05-05 16:47

Hi,

ich denke es geht markuswerner nicht darum einen genau auf ihn zugeschnittenen Bayes-Filter zu bekommen, sondern die ganz gewöhnlichen Spammails ala "Enlarge youre penis" oder "Bye Viagra online" in den Filter zu bekommen. Und dies geht eben am besten über Tausende von diesen Mails.
Und wenn man, aus welchen Gründen auch immer, nicht alzu viele davon hat, hat man ein Problem. Dann heist es eben warten bis genug da sind oder sich eben Spam "besorgen".

Und da mir meine Platte schon mal abgeschmiert ist und ich danach verzweifelt versucht habe spamassassin schnell ohne alzu viel eigenen "vorrätigen" Spam auf eine anständige quote zu bekommen kann ich das irgendwie nachvolziehen...

Ich hoffe ich hab Dich da richtig verstanden markuswerner :?: :!:
Wenn da noch nicht genug sind, könntest Du Deine EMailadresse auf eine bekannte Webseite bringen %)
Ich weiss jetzt nicht ob das sooo eine sinnvolle antwort ist?

...man liest sich,
Carsten

charlie
Posts: 78
Joined: 2002-09-30 23:36

Re: Ã?ffentliche Spam-Sammlung

Post by charlie » 2004-05-05 21:11

HI,

also ich arbeit auch mit dem sa-learn von Spamassassin und bin im großen und ganzen sehr zufrieden. Zwei mal Spams eingelesen und er kennt alles was so anfällt. Noch die Autowhiteliste einschalten und man ist für das nächste halbe Jahr geschützt.
Wenn du Spams haben willst ich habe noch ein paar tauschend auf dem Server liegen, dem Ham musst dir allerdings selber zusammenstellen.


Charlie

deacon frost
Posts: 28
Joined: 2003-03-18 16:59

Re: Ã?ffentliche Spam-Sammlung

Post by deacon frost » 2004-05-05 22:03

auf irgendwelchen thebat-Seiten gibts Spam-Mails als Archiv zum Download. Würde mal die bekanntesten durchstöbern

markuswerner
Posts: 7
Joined: 2004-01-24 14:14

Re: Ã?ffentliche Spam-Sammlung

Post by markuswerner » 2004-05-06 10:21

@crocodoc: Danke, genau so meine ich das. Ich möchte den gröbsten Quatsch erstmal filtern und dann kann ich immer noch Feintuning für meine speziellen Bedürfnisse betreiben.

@charlie: Ham habe ich, wie gesagt, Tonnen von Spam will ich. Bitte, gebt mir Spam!! ;-)

@Deacon Frost: In einem anderen Forum hat mir jemand den selben Tip gegeben. Ich gucke mal nach:
"Ich meine auf http://www.batworld.de gab es so eine Sammlung. Allerdings ist die Seite derzeit offenbar nicht erreichbar..."

Gruss,
Markus