====== Unterschiede ====== Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
de:features [2009/03/03 13:49] 127.0.0.1 Externe Bearbeitung |
de:features [2024/09/18 08:31] (aktuell) |
||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ====== regain Features ====== | + | ====== Features ====== |
+ | |||
+ | Diese Seite fasst die wichtigsten **Features** von regain zusammen. | ||
===== Steckbrief ===== | ===== Steckbrief ===== | ||
+ | |||
* **regain** ist eine anfrageorientierte, effiziente, weitgehend vom Betriebssystem unabhängige Suchmaschine. | * **regain** ist eine anfrageorientierte, effiziente, weitgehend vom Betriebssystem unabhängige Suchmaschine. | ||
* Mit regain können große Datenmengen indiziert und dann in Sekundenbruchteilen durchsucht werden. | * Mit regain können große Datenmengen indiziert und dann in Sekundenbruchteilen durchsucht werden. | ||
* Es können Dateien (Text, HTML, XML, Excel, Powerpoint, Word, PDF, RTF, usw.) lokal, auf Netzlaufwerken oder Intranet-Servern sowie ganze HTTP-Webauftritte/Webserver durchsucht werden. | * Es können Dateien (Text, HTML, XML, Excel, Powerpoint, Word, PDF, RTF, usw.) lokal, auf Netzlaufwerken oder Intranet-Servern sowie ganze HTTP-Webauftritte/Webserver durchsucht werden. | ||
- | * regain ist kostenlos und unterliegt der [http://de.wikipedia.org/wiki/LGPL Lesser General Public License] (LGPL) | + | * regain ist Open Source, damit kostenlos und unterliegt der [[http://de.wikipedia.org/wiki/LGPL|Lesser General Public License]] (LGPL) |
- | * Es gibt eine [[Desktop-Suche]] als stand alone-Programm für Arbeitsplatzrechner, sowie eine [http://regain.murfman.de/wiki/de/index.php?title=Vergleich_der_regain-Varianten Server-Suche]. | + | * Es gibt eine **Desktop-Variante** als stand alone-Programm für Arbeitsplatzrechner, sowie eine **Server-Variante**. Siehe: [[:de:project_info:variant_comparison]] |
- | * Das Erscheinungsbild / Aussehen / Format der [[Web-Oberfläche]] / [[Suchmaske]] ist beliebig anpassbar. | + | * Das Aussehen der [[:components:search mask|Suchmaske]] ist beliebig anpassbar. |
- | * Für Anwender und Entwickler gibt es eine ausführliche [http://regain.sourceforge.net/docs.php Dokumentation] | + | * Für Anwender und Entwickler gibt es eine ausführliche [[http://regain.sourceforge.net/docs.php|Dokumentation]] |
- | * Das deutsch- bzw. englischsprachige [http://forum.murfman.de/de/viewforum.php?f=13 Forum] liefert Hilfe bei Problemen / Fragen. | + | * Das deutsch- bzw. englischsprachige [[http://forum.murfman.de/de/viewforum.php?f=13|Forum]] liefert Hilfe bei Problemen und Fragen. |
* regain ist flexibel, anpassbar und erweiterbar. | * regain ist flexibel, anpassbar und erweiterbar. | ||
- | * **regain** nutzt die mächtige [http://jakarta.apache.org/lucene/docs/queryparsersyntax.html Suchsyntax] von Lucene. Damit lassen sich sehr gezielte Suchanfragen formulieren. | + | * regain nutzt die mächtige [[http://lucene.apache.org/java/2_3_2/queryparsersyntax.html|Suchsyntax von Lucene]]. Damit lassen sich sehr gezielte Suchanfragen formulieren. |
+ | |||
+ | |||
+ | ===== Die Suche ===== | ||
+ | |||
+ | * Regain nutzt die mächtige Suchsyntax von Lucene. Damit ist es möglich, sehr genaue Suchanfragen zu stellen. Details siehe [[:de:usage:searching]]. | ||
+ | * [[:de:features:advanced search]]: Definieren Sie Ihre Suchanfrage noch genauer, um bessere Treffer zu bekommen. | ||
+ | * [[:de:features:multi_index_search]]: Durchsuchen sie über mehrere Indizes gleichzeitig. | ||
+ | * URL-Rewriting: Damit können Dokumente z.B. von ''<nowiki>file://c:/www-data/intranet/docs</nowiki>'' indiziert und im Browser als ''<nowiki>http://intranet.murfman.de/docs</nowiki>'' angezeigt werden. | ||
+ | * [[:de:features:file-to-http-bridge]]: Stellt die Dateien, die im Index sind, über das http-Protokoll zur Verfügung. | ||
- | ===== Die wichtigsten Suchmöglichkeiten ===== | ||
- | ;Bool'sche Operatoren: <small>z.B.:<nowiki>"Lucene AND regain"</nowiki> oder <nowiki>"+Lucene -Zoe"</nowiki></small> | ||
- | ;Wildcards: <small>z.B.:<nowiki>"te?t" oder "text*"</nowiki></small> | ||
- | ;Phonetische Suche: <small>z.B.:<nowiki>"Maier~"</nowiki></small> | ||
- | ;Gruppierung: <small>z.B.:<nowiki>"(Jakarta AND Lucene) OR regain"</nowiki></small> | ||
- | ;Suche in [[Suchindex#Standardfelder|Index-Feldern]]: <small>z.B.:<nowiki>"Lucene title:Seminararbeit"</nowiki></small> | ||
- | ;Erweiterte Suche: Definieren Sie Ihre Suchanfrage noch genauer, um bessere Treffer zu bekommen. Mehr zur [[Suchen#Sucharten|Erweiterten Suche]]. | ||
- | ;Multiindex-Suche: Durchsuchen sie über eine [[Suchmaske]] mehrere Indizes gleichzeitig. Mehr zur [[Multiindex-Suche]]. | ||
- | ;URL-Rewriting: Damit können Dokumente von ''file://c:/www-data/intranet/docs'' indiziert und im Browser als ''<nowiki>http://intranet.murfman.de/docs</nowiki>'' angezeigt werden. Mehr zum [[URL-Rewriting]]. | ||
- | ;File-zu-Http-Brücke: Stellt die Dateien im Index sind, über das http-Protokoll zur Verfügung. Mehr zur [[File-zu-Http-Brücke]]. | ||
===== Festlegung des Suchraums ===== | ===== Festlegung des Suchraums ===== | ||
- | Mit regain können Sie sehr genau festlegen, was wann in den [[Suchindex]] kommen soll und was nicht. | + | Mit regain können Sie sehr genau festlegen, was wann in den [[:de:components:search index|Suchindex]] kommen soll und was nicht. |
+ | |||
+ | * [[:de:features:white and black list]]: Durch eine White List und eine Black List läßt sich der aufzubereitende Suchraum genau eingrenzen. | ||
+ | * Mehrere Datenquellen pro Index: Ein Suchindex kann Dokumente von verschiedenen Dateisystemen und / oder Webseiten enthalten. | ||
+ | * Partielle Indexierung: Die Aktualisierung eines Suchindex kann für die verschiedenen Datenquellen zu unterschiedlichen Zeitpunkten erfolgen. | ||
- | ;Weiße und Schwarze Liste: Durch eine White List und eine Black List läßt sich der aufzubereitende Suchraum genau eingrenzen. Mehr zu [[Weiße und Schwarze Liste]]. | ||
- | ;Mehrere Datenquellen pro Index: Ein Suchindex kann Dokumente von verschiedenen Dateisystemen und / oder Webseiten bzw. Themen beinhalten. Mehr zu [[Mehrere Datenquellen pro Index|mehreren Datenquellen pro Index]]. | ||
- | ;Partielle Indexierung: Die Aktualisierung eines Suchindex kann für die verschiedenen Datenquellen zu unterschiedlichen Zeitpunkten erfolgen. Mehr zur [[Partielle Indexierung|partiellen Indexierung]]. | ||
===== Indexierung ===== | ===== Indexierung ===== | ||
- | ;Hot-Deployment: Suchindex-Wechsel/Erweiterung ohne Neustart der [[Server|Servlet-Engine]]! Mehr zu [[Hot-Deployment]]. | + | * Hot-Deployment: Der Suchindex kann im laufenden Betrieb erweitert oder gewechselt werden - ohne Neustart des Servers. |
- | ;Stopword-Liste: Bestimmen Sie Worte, die nicht indexiert werden sollen. Mehr zur [[Stopword-Liste]]. | + | * [[:de:terminology#Stopword-Liste]]: Bestimmen Sie Worte, die nicht indexiert werden sollen. |
- | ;Analyse-Dateien: Lassen Sie sich alle Zwischenschritte der Indexierung als Dateien ausgeben. Mehr zu [[Analyse-Dateien]]. | + | * [[:de:features:analysis files]]: Lassen Sie sich alle Zwischenschritte der Indexierung in Dateien ausgeben. |
- | ;Content-Extraktion für HTML: Indexieren Sie bei Ihren HTML-Dokumenten nur den eigentlichen Inhalt, ohne Navigation und Fußleiste. Mehr zur [[Content-Extraktion für HTML|Content-Extraktion]]. | + | * Content-Extraktion für HTML: Indexieren Sie bei Ihren HTML-Dokumenten nur den eigentlichen Inhalt, ohne Navigation und Fußleiste. |
- | ;Pfad-Extraktion für HTML: Zeigen Sie den Navigationspfad Ihrer HTML-Seiten bei den Suchergebnissen. Mehr zur [[Pfad-Extraktion für HTML|Pfad-Extraktion]] | + | * Pfad-Extraktion für HTML: Zeigen Sie den Navigationspfad Ihrer HTML-Seiten bei den Suchergebnissen. |
- | ;Erkennung von Dead Links: Quasi als Abfallprodukt werden alle gefundenen Dead Links (also Links auf nicht mehr vorhandene Dokumente) ausgegeben. Mehr zur [[Erkennung von Dead Links]]. | + | * Erkennung von Dead Links: Quasi als Abfallprodukt werden alle gefundenen Dead Links (also Links auf nicht mehr vorhandene Dokumente) ausgegeben. |
- | ;Breakpoints: Der Crawler kopiert während der Indexierung regelmäßig den aktuellen Stand des [[Suchindex]] in ein gesondertes Verzeichnis. Mehr zu [[Breakpoint]]s. | + | * [[:de:features:breakpoint]]: Der [[:de:components:Crawler]] kopiert während der Indexierung regelmäßig den aktuellen Stand des [[:de:components:search index|Suchindex]] in ein gesondertes Verzeichnis. Bricht die Indexierung ab, kann der Crawler auf dem letzten Breakpoint aufsetzen. |
- | ;Zusatzfelder: Der Index kann um weitere Indexfelder erweitert werden. Mehr zu [[Zusatzfelder]]n. | + | * [[:de:features:auxiliary fields]]: Der Index kann um weitere Indexfelder erweitert werden. |
===== Erweiterbarkeit und Anpassung ===== | ===== Erweiterbarkeit und Anpassung ===== | ||
- | ;Präparatoren: Sie übernehmen die Aufbereitung und Extrahierung von Texten/Informationen aus den verschiedenen Dateiformaten. Mehr zu [[Präparator]]en. | + | * [[:de:components:preparator|Präparatoren]]: Sie übernehmen die Aufbereitung und Extrahierung von Texten/Informationen aus den verschiedenen Dateiformaten. |
- | ;TagLibrary für die Suche: Hiermit ist die Anpassung der JSP-Suchmaske an Ihr Design besonders einfach. Mehr zur [[TagLibrary für die Suche]] | + | * TagLibrary für die Suche: Hiermit ist die Anpassung der [[:de:components:search mask|Suchmaske]] an Ihr Design besonders einfach. |
- | ;Konfigurierbarkeit: regain ist weitgehend anpassbar. Mehr zur [[Server:Konfiguration | Konfiguration]] | + | * [[:de:config|Konfigurierbarkeit]]: regain ist weitgehend anpassbar. |
- | ;Zugriffsrechte-Management: Es sorgt dafür, dass ein Benutzer nur Treffer für Dokumente erhält, für die er auch Leserechte hat. Mehr zum [[Zugriffsrechte-Management]]. | + | * [[:de:features:access rights management]]: Es sorgt dafür, dass ein Benutzer nur Treffer für Dokumente erhält, für die er auch Leserechte hat. |