Page 1 of 1
Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-16 02:40
by hjmaier
Hallo alle zusammen,
zuerst meine Idee kurz geschildert:
Für einen eng begrenzten Themenbereich (ca. 15 Seiten im Netz) möchte ich eine Suchmaschine auf meinem Server einrichten. Ich brauche also Eine Software die als Crawler arbeitet, die Ergebnisse verwaltet und dann auch eine Suche per Webinterface vernünftig auswerten und ausgeben kann.
Kennt einer von euch Software empfehlen?
Viele Grüße
hj
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-16 07:05
by flo
Schau Dir doch mal htdig an ...
flo.
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-16 08:26
by hjmaier
Besten Dank Flo.
Viele Grüße
hj
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-16 11:04
by Roger Wilco
hjmaier wrote:Kennt einer von euch Software empfehlen?
Wenn du keine eigene Software installieren möchtest, kannst du auch Google wunderbar dazu "mißbrauchen". Wie das dann aussieht, kannst du an der Apache-Doku sehen.
Wenn du das Ganze dann in deiner Seite verwursteln willst, kannst du die API von Google nutzen, um die Ergebnisse über einen Webservice zu erhalten.
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-18 09:47
by hjmaier
Danke für den Hinweis, Roger. Ich habe jetzt trotzdem htdig installiert. Mir ist einfach wohler bei dem Gedanken selbst etwas aufzusetzen.
Die ersten Tests gestern verliefen erfolgreich. Ich habe zwar noch ein paar Basteleien zu erledigen (z.B. merkwürdige Abbrüche beim indizieren, was manuelle Starts von Folgeprogrammen erfordert), aber die ersten Ergebnisse sind vielversprechend.
Viele Grüße und danke nochmal
hj
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-18 12:01
by flo
htdig ist auch schon ewig auf dem Markt und sollte demzufolge halbwegs stabil und zuverlässig laufen ...
Freut mich, daß es klappt!
flo.
Freie Software Perlfect
Posted: 2005-07-19 20:03
by Anonymous
http://www.perlfect.com/freescripts/search/
Kann ich empfehlen, läßt sich schnell integrieren und gut anpassen.
Re: Freie Software Perlfect
Posted: 2005-07-20 21:26
by floschi
Nutzt du die auch für PDFs, geht das gut? Wie oft indizierst du, frißt das viel Last? Wie groß sind deine Datenbestände?
Ich frag so doof, weil ich genau soetwas suche und htdig noch keine PDFs, Words, OpenOffices usw. kann...
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-20 21:33
by Anonymous
Hmm, leider weiss ich das gerade nicht. Sorry.
Einsetzen tu ich das auf der Seite
http://www.t-h.de , da kannst ja mal nen Blick reinwerden. Vielmehr hab ich damit auch noch nicht gemacht.
Ob es besser ist als htdig weiss ich nicht, aber poste mal bitte wenn Du mehr darüber rausbekommst.
http://www.perlfect.com/freescripts/search/
"Can index PDF files (requires pdftotext, which is part of xpdf) and MS-Word files (requires antiword)."
Getestet habe ich es aber nicht.
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-20 23:36
by andreask2
Re: Freie Software Perlfect
Posted: 2005-07-20 23:45
by andreask2
olfi wrote:Ich frag so doof, weil ich genau soetwas suche und htdig noch keine PDFs, Words, OpenOffices usw. kann...
sicher?
http://www.htdig.org/FAQ.html#q4.8
http://www.htdig.org/FAQ.html#q4.9
Funktioniert AFAIK so wie bei den anderen auch, eben mit externer Umwandlung. Der einziger der das evtl. etwas effizienter machen kann, ist vermutlich
lucene, hier kann man AFAIR direkt entsprechende Jakarta Bibliotheken verwenden.
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-21 08:51
by andreask2
Re: Suchmaschine betreiben - Kennt jemand Software?
Posted: 2005-07-22 10:08
by floschi
Danke für die Links ;-)