Page 1 of 1

Webalizer SearchEngine-Finetuning

Posted: 2005-09-05 14:27
by Joe User
Moin,

da Google zu diesem Thema leider nicht so gesprächig ist, wie ich erwartet hatte, wende ich mich mit meinem Anliegen einfach mal an Euch:
Ich bin auf der Suche nach zuverlässigen/aktuellen SearchEngine-Optionen für Webalizer, da meine zu kompakt/primitiv sind und dementsprechend unnötige false positives erzeugen :roll:

Danke & Gruss,
Joe User

Re: Webalizer SearchEngine-Finetuning

Posted: 2005-09-05 17:28
by dodolin
Vor langer Zeit hatte ich mir da ein paar Anpassungen gemacht, keine Ahnung, ob die noch aktuell sind. Siehe http://www.dodolin.de/stats/webalizer/w ... fault.conf

Code: Select all

SearchEngine    yahoo.com       p=
SearchEngine    altavista.com   q=
#SearchEngine    google.com      q=
SearchEngine    eureka.com      q=
#SearchEngine    lycos.com       query=
SearchEngine    hotbot.com      MT=
SearchEngine    msn.com         MT=
SearchEngine    infoseek.com    qt=
SearchEngine    webcrawler      searchText=
SearchEngine    excite          search=
SearchEngine    netscape.com    search=
SearchEngine    mamma.com       query=
SearchEngine    alltheweb.com   query=
SearchEngine    northernlight.com  qr=

# Above from sample.conf. Below my additions.
SearchEngine	google		q=
SearchEngine	web.de		su=
SearchEngine	fireball.de	q=
SearchEngine	lycos		query=
SearchEngine	abacho.de	q=
SearchEngine	allesklar.de	words=

Re: Webalizer SearchEngine-Finetuning

Posted: 2005-09-06 20:23
by Joe User
Eine relativ aktuelle Liste gibt es unter: http://griho.udl.es/webalizer/webalizer.conf.txt

HTH

Re: Webalizer SearchEngine-Finetuning

Posted: 2005-09-06 20:57
by dodolin
Wow, das ist ja riessig! Und der benutzt u.a. meine Liste, witzig. Haette ich ja nicht gedacht, dass irgendjemand das mal nutzen koennte/wuerde. Warum man aber Google per IP listet habe ich noch nicht verstanden?

Re: Webalizer SearchEngine-Finetuning

Posted: 2005-09-07 10:25
by Joe User
Einige Google-Server senden leider statt dem FQDN die IP als Referrer, so dass ohne die Angabe dieser IPs die Auswertung des Suchstrings ausgehebelt werden würde.