[S] Dokumentenindexer
Posted: 2011-03-25 14:33
Moin,
ich suche eine leichtgewichtige Alternative zu Sphinx mit der statische Dokumente (HTML, XML, PDF, PlainText) indexiert und durchsucht werden können.
Die Dokumente liegen direkt im Dateisystem, also keine Skriptsprachen und Datenbanken im Spiel, über mehrere Verzeichnisse verteilt und es werden bis zu 100.000 Dokumente erwartet. Der Index soll stündlich per Cron aktualisiert und webbasiert durchsucht werden können.
Voraussetzungen:
Joe User
ich suche eine leichtgewichtige Alternative zu Sphinx mit der statische Dokumente (HTML, XML, PDF, PlainText) indexiert und durchsucht werden können.
Die Dokumente liegen direkt im Dateisystem, also keine Skriptsprachen und Datenbanken im Spiel, über mehrere Verzeichnisse verteilt und es werden bis zu 100.000 Dokumente erwartet. Der Index soll stündlich per Cron aktualisiert und webbasiert durchsucht werden können.
Voraussetzungen:
- Open-Source
- C, C++, Perl, Python oder PHP5
- Dateibasierter Index (keine Datenbank)
- Kostenfreie kommerzielle Nutzung
Joe User