Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:features

====== Unterschiede ====== Hier werden die Unterschiede zwischen zwei Versionen gezeigt.

Link zu dieser Vergleichsansicht

Nächste Überarbeitung
Vorhergehende Überarbeitung
de:features [2009/03/03 13:49]
127.0.0.1 Externe Bearbeitung
de:features [2024/09/18 08:31] (aktuell)
Zeile 1: Zeile 1:
-====== ​regain ​Features ======+====== Features ====== 
 + 
 +Diese Seite fasst die wichtigsten **Features** von regain zusammen.
  
  
 ===== Steckbrief ===== ===== Steckbrief =====
 +
   * **regain** ist eine anfrageorientierte,​ effiziente, weitgehend vom Betriebssystem unabhängige Suchmaschine.   * **regain** ist eine anfrageorientierte,​ effiziente, weitgehend vom Betriebssystem unabhängige Suchmaschine.
   * Mit regain können große Datenmengen indiziert und dann in Sekundenbruchteilen durchsucht werden.   * Mit regain können große Datenmengen indiziert und dann in Sekundenbruchteilen durchsucht werden.
   * Es können Dateien (Text, HTML, XML, Excel, Powerpoint, Word, PDF, RTF, usw.) lokal, auf Netzlaufwerken oder Intranet-Servern sowie ganze HTTP-Webauftritte/​Webserver durchsucht werden.   * Es können Dateien (Text, HTML, XML, Excel, Powerpoint, Word, PDF, RTF, usw.) lokal, auf Netzlaufwerken oder Intranet-Servern sowie ganze HTTP-Webauftritte/​Webserver durchsucht werden.
-  * regain ist kostenlos und unterliegt der [http://​de.wikipedia.org/​wiki/​LGPL Lesser General Public License] (LGPL) +  * regain ist Open Source, damit kostenlos und unterliegt der [[http://​de.wikipedia.org/​wiki/​LGPL|Lesser General Public License]] (LGPL) 
-  * Es gibt eine [[Desktop-Suche]] ​als  stand alone-Programm für Arbeitsplatzrechner,​ sowie eine [http://​regain.murfman.de/​wiki/​de/​index.php?​title=Vergleich_der_regain-Varianten Server-Suche]. +  * Es gibt eine **Desktop-Variante** ​als  stand alone-Programm für Arbeitsplatzrechner,​ sowie eine **Server-Variante**. Siehe: [[:de:​project_info:​variant_comparison]
-  * Das Erscheinungsbild / Aussehen ​/ Format ​der [[Web-Oberfläche]] / [[Suchmaske]] ist beliebig anpassbar. +  * Das Aussehen der [[:​components:​search mask|Suchmaske]] ist beliebig anpassbar. 
-  * Für Anwender und Entwickler gibt es eine ausführliche [http://​regain.sourceforge.net/​docs.php Dokumentation]  +  * Für Anwender und Entwickler gibt es eine ausführliche ​[[http://​regain.sourceforge.net/​docs.php|Dokumentation]
-  * Das deutsch- bzw. englischsprachige [http://​forum.murfman.de/​de/​viewforum.php?​f=13 Forum] liefert Hilfe bei Problemen ​Fragen.+  * Das deutsch- bzw. englischsprachige ​[[http://​forum.murfman.de/​de/​viewforum.php?​f=13|Forum]] liefert Hilfe bei Problemen ​und Fragen.
   * regain ist flexibel, anpassbar und erweiterbar.   * regain ist flexibel, anpassbar und erweiterbar.
-  ​* **regain** nutzt die mächtige [http://jakarta.apache.org/​lucene/docs/​queryparsersyntax.html Suchsyntaxvon Lucene. Damit lassen sich sehr gezielte Suchanfragen formulieren.+  * regain nutzt die mächtige ​[[http://lucene.apache.org/​java/2_3_2/​queryparsersyntax.html|Suchsyntax von Lucene]]. Damit lassen sich sehr gezielte Suchanfragen formulieren
 + 
 + 
 +===== Die Suche ===== 
 + 
 +  * Regain nutzt die mächtige Suchsyntax von Lucene. Damit ist es möglich, sehr genaue Suchanfragen zu stellen. Details siehe [[:​de:​usage:​searching]]. 
 +  * [[:​de:​features:​advanced search]]: Definieren Sie Ihre Suchanfrage noch genauer, um bessere Treffer zu bekommen. 
 +  * [[:​de:​features:​multi_index_search]]:​ Durchsuchen sie über mehrere Indizes gleichzeitig. 
 +  * URL-Rewriting: ​ Damit können Dokumente z.B. von ''<​nowiki>​file://​c:/​www-data/​intranet/​docs</​nowiki>''​ indiziert und im Browser als ''<​nowiki>​http://​intranet.murfman.de/​docs</​nowiki>''​ angezeigt werden. 
 +  * [[:​de:​features:​file-to-http-bridge]]:​ Stellt die Dateien, die im Index sind, über das http-Protokoll zur Verfügung.
  
-===== Die wichtigsten Suchmöglichkeiten ===== 
-;​Bool'​sche Operatoren: <​small>​z.B.:<​nowiki>"​Lucene AND regain"</​nowiki>​ oder <​nowiki>"​+Lucene -Zoe"</​nowiki></​small>​ 
-;Wildcards: <​small>​z.B.:<​nowiki>"​te?​t"​ oder "​text*"</​nowiki></​small>​ 
-;​Phonetische Suche: <​small>​z.B.:<​nowiki>"​Maier~"</​nowiki></​small>​ 
-;​Gruppierung:​ <​small>​z.B.:<​nowiki>"​(Jakarta AND Lucene) OR regain"</​nowiki></​small>​ 
-;Suche in [[Suchindex#​Standardfelder|Index-Feldern]]:​ <​small>​z.B.:<​nowiki>"​Lucene title:​Seminararbeit"</​nowiki></​small>​ 
-;Erweiterte Suche: Definieren Sie Ihre Suchanfrage noch genauer, um bessere Treffer zu bekommen. Mehr zur [[Suchen#​Sucharten|Erweiterten Suche]]. 
-;​Multiindex-Suche:​ Durchsuchen sie über eine [[Suchmaske]] mehrere Indizes gleichzeitig. Mehr zur [[Multiindex-Suche]]. 
-;​URL-Rewriting: ​ Damit können Dokumente von ''​file://​c:/​www-data/​intranet/​docs''​ indiziert und im Browser als ''<​nowiki>​http://​intranet.murfman.de/​docs</​nowiki>''​ angezeigt werden. Mehr zum [[URL-Rewriting]]. 
-;​File-zu-Http-Brücke:​ Stellt die Dateien im Index sind, über das http-Protokoll zur Verfügung. Mehr zur [[File-zu-Http-Brücke]]. 
  
 ===== Festlegung des Suchraums ===== ===== Festlegung des Suchraums =====
  
-Mit regain können Sie sehr genau festlegen, was wann in den [[Suchindex]] kommen soll und was nicht.+Mit regain können Sie sehr genau festlegen, was wann in den [[:​de:​components:​search index|Suchindex]] kommen soll und was nicht
 + 
 +  * [[:​de:​features:​white and black list]]: Durch eine White List und eine Black List läßt sich der aufzubereitende Suchraum genau eingrenzen. 
 +  * Mehrere Datenquellen pro Index: Ein Suchindex kann Dokumente von verschiedenen Dateisystemen und / oder Webseiten enthalten. 
 +  * Partielle Indexierung:​ Die Aktualisierung eines Suchindex kann für die verschiedenen Datenquellen zu unterschiedlichen Zeitpunkten erfolgen.
  
-;Weiße und Schwarze Liste: Durch eine White List und eine Black List läßt sich der aufzubereitende Suchraum genau eingrenzen. Mehr zu [[Weiße und Schwarze Liste]]. 
-;Mehrere Datenquellen pro Index: Ein Suchindex kann Dokumente von verschiedenen Dateisystemen und / oder Webseiten bzw. Themen beinhalten. Mehr zu [[Mehrere Datenquellen pro Index|mehreren Datenquellen pro Index]]. 
-;Partielle Indexierung:​ Die Aktualisierung eines Suchindex kann für die verschiedenen Datenquellen zu unterschiedlichen Zeitpunkten erfolgen. Mehr zur [[Partielle Indexierung|partiellen Indexierung]]. 
  
 ===== Indexierung ===== ===== Indexierung =====
  
-;Hot-Deployment:​ Suchindex-Wechsel/​Erweiterung ​ohne Neustart ​der [[Server|Servlet-Engine]]! Mehr zu [[Hot-Deployment]]. +  * Hot-Deployment: ​Der Suchindex ​kann im laufenden Betrieb erweitert oder gewechselt werden ​- ohne Neustart ​des Servers. 
-;​Stopword-Liste: Bestimmen Sie Worte, die nicht indexiert werden sollen. ​Mehr zur [[Stopword-Liste]]+  * [[:​de:​terminology#​Stopword-Liste]]: Bestimmen Sie Worte, die nicht indexiert werden sollen. 
-;​Analyse-Dateien: Lassen Sie sich alle Zwischenschritte der Indexierung ​als Dateien ausgeben. Mehr zu [[Analyse-Dateien]]+  * [[:​de:​features:​analysis files]]: Lassen Sie sich alle Zwischenschritte der Indexierung ​in Dateien ausgeben. 
-;Content-Extraktion für HTML: Indexieren Sie bei Ihren HTML-Dokumenten nur den eigentlichen Inhalt, ohne Navigation und Fußleiste. Mehr zur [[Content-Extraktion für HTML|Content-Extraktion]]+  ​* ​Content-Extraktion für HTML: Indexieren Sie bei Ihren HTML-Dokumenten nur den eigentlichen Inhalt, ohne Navigation und Fußleiste. 
-;Pfad-Extraktion für HTML: Zeigen Sie den Navigationspfad Ihrer HTML-Seiten bei den Suchergebnissen. ​Mehr zur [[Pfad-Extraktion für HTML|Pfad-Extraktion]] +  ​* ​Pfad-Extraktion für HTML: Zeigen Sie den Navigationspfad Ihrer HTML-Seiten bei den Suchergebnissen. 
-;Erkennung von Dead Links: Quasi als Abfallprodukt werden alle gefundenen Dead Links (also Links auf nicht mehr vorhandene Dokumente) ausgegeben. ​Mehr zur [[Erkennung von Dead Links]]+  ​* ​Erkennung von Dead Links: Quasi als Abfallprodukt werden alle gefundenen Dead Links (also Links auf nicht mehr vorhandene Dokumente) ausgegeben. 
-;​Breakpoints: Der Crawler kopiert während der Indexierung regelmäßig den aktuellen Stand des [[Suchindex]] in ein gesondertes Verzeichnis.  ​Mehr zu [[Breakpoint]]s. +  * [[:​de:​features:​breakpoint]]: Der [[:​de:​components:​Crawler]] kopiert während der Indexierung regelmäßig den aktuellen Stand des [[:​de:​components:​search index|Suchindex]] in ein gesondertes Verzeichnis. ​Bricht die Indexierung ab, kann der Crawler auf dem letzten Breakpoint aufsetzen. 
-;​Zusatzfelder: Der Index kann um weitere Indexfelder erweitert werden. ​Mehr zu [[Zusatzfelder]]n.+  [[:​de:​features:​auxiliary fields]]: Der Index kann um weitere Indexfelder erweitert werden. 
  
 ===== Erweiterbarkeit und Anpassung ===== ===== Erweiterbarkeit und Anpassung =====
  
-;Präparatoren:​ Sie übernehmen die Aufbereitung und Extrahierung von Texten/​Informationen aus den  verschiedenen Dateiformaten. Mehr zu [[Präparator]]en+  * [[:​de:​components:​preparator|Präparatoren]]: Sie übernehmen die Aufbereitung und Extrahierung von Texten/​Informationen aus den verschiedenen Dateiformaten. 
-;TagLibrary für die Suche: Hiermit ist die Anpassung der JSP-Suchmaske an Ihr Design besonders einfach. ​Mehr zur [[TagLibrary für die Suche]] +  ​* ​TagLibrary für die Suche: Hiermit ist die Anpassung der [[:​de:​components:​search mask|Suchmaske]] an Ihr Design besonders einfach. 
-;​Konfigurierbarkeit: regain ist weitgehend anpassbar. ​Mehr zur [[Server:Konfiguration | Konfiguration]] +  * [[:​de:​config|Konfigurierbarkeit]]: regain ist weitgehend anpassbar. 
-;​Zugriffsrechte-Management: Es sorgt dafür, dass ein Benutzer nur Treffer für Dokumente erhält, für die er auch Leserechte hat. Mehr zum [[Zugriffsrechte-Management]].+  * [[:de:​features:​access rights management]]: Es sorgt dafür, dass ein Benutzer nur Treffer für Dokumente erhält, für die er auch Leserechte hat.
  
de/features.1236084553.txt.gz · Zuletzt geändert: 2024/09/18 08:31 (Externe Bearbeitung)