Diese Seite fasst die wichtigsten Features von regain zusammen.
regain ist eine anfrageorientierte, effiziente, weitgehend vom Betriebssystem unabhängige Suchmaschine.
Mit regain können große Datenmengen indiziert und dann in Sekundenbruchteilen durchsucht werden.
Es können Dateien (Text,
HTML,
XML, Excel, Powerpoint, Word,
PDF,
RTF, usw.) lokal, auf Netzlaufwerken oder Intranet-Servern sowie ganze
HTTP-Webauftritte/Webserver durchsucht werden.
-
-
Das Aussehen der
Suchmaske ist beliebig anpassbar.
Für Anwender und Entwickler gibt es eine ausführliche
Dokumentation
Das deutsch- bzw. englischsprachige
Forum liefert Hilfe bei Problemen und Fragen.
regain ist flexibel, anpassbar und erweiterbar.
regain nutzt die mächtige
Suchsyntax von Lucene. Damit lassen sich sehr gezielte Suchanfragen formulieren.
Regain nutzt die mächtige Suchsyntax von Lucene. Damit ist es möglich, sehr genaue Suchanfragen zu stellen. Details siehe
Suchen mit regain.
Erweiterte Suche: Definieren Sie Ihre Suchanfrage noch genauer, um bessere Treffer zu bekommen.
-
URL-Rewriting: Damit können Dokumente z.B. von
file://c:/www-data/intranet/docs indiziert und im Browser als
http://intranet.murfman.de/docs angezeigt werden.
File-zu-Http-Brücke: Stellt die Dateien, die im Index sind, über das http-Protokoll zur Verfügung.
Mit regain können Sie sehr genau festlegen, was wann in den Suchindex kommen soll und was nicht.
White List und Black List: Durch eine White List und eine Black List läßt sich der aufzubereitende Suchraum genau eingrenzen.
Mehrere Datenquellen pro Index: Ein Suchindex kann Dokumente von verschiedenen Dateisystemen und / oder Webseiten enthalten.
Partielle Indexierung: Die Aktualisierung eines Suchindex kann für die verschiedenen Datenquellen zu unterschiedlichen Zeitpunkten erfolgen.
Hot-Deployment: Der Suchindex kann im laufenden Betrieb erweitert oder gewechselt werden - ohne Neustart des Servers.
Stopword-Liste: Bestimmen Sie Worte, die nicht indexiert werden sollen.
Analyse-Dateien: Lassen Sie sich alle Zwischenschritte der Indexierung in Dateien ausgeben.
Content-Extraktion für
HTML: Indexieren Sie bei Ihren
HTML-Dokumenten nur den eigentlichen Inhalt, ohne Navigation und Fußleiste.
Pfad-Extraktion für
HTML: Zeigen Sie den Navigationspfad Ihrer
HTML-Seiten bei den Suchergebnissen.
Erkennung von Dead Links: Quasi als Abfallprodukt werden alle gefundenen Dead Links (also Links auf nicht mehr vorhandene Dokumente) ausgegeben.
Breakpoints: Der
Crawler kopiert während der Indexierung regelmäßig den aktuellen Stand des
Suchindex in ein gesondertes Verzeichnis. Bricht die Indexierung ab, kann der Crawler auf dem letzten Breakpoint aufsetzen.
Zusatzfelder: Der Index kann um weitere Indexfelder erweitert werden.
Präparatoren: Sie übernehmen die Aufbereitung und Extrahierung von Texten/Informationen aus den verschiedenen Dateiformaten.
TagLibrary für die Suche: Hiermit ist die Anpassung der
Suchmaske an Ihr Design besonders einfach.
-
Zugriffsrechte-Management: Es sorgt dafür, dass ein Benutzer nur Treffer für Dokumente erhält, für die er auch Leserechte hat.