Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:components

====== Unterschiede ====== Hier werden die Unterschiede zwischen zwei Versionen gezeigt.

Link zu dieser Vergleichsansicht

Nächste Überarbeitung
Vorhergehende Überarbeitung
de:components [2009/03/03 13:49]
127.0.0.1 Externe Bearbeitung
de:components [2024/09/18 08:31] (aktuell)
Zeile 1: Zeile 1:
-====== ​The main components of regain ======+====== ​Die wichtigsten Komponenten von regain ======
  
-The basic job done by regain ​isThe **crawler** searches for documentsextracts their text and stores it in **search index**. Using this index, the **search mask** can answer search queries from users in nearly no timeFor writing and using the search index, ​regain ​is using a library called ​**Lucene**.+Grob betrachtet arbeitet ​regain ​folgendermaßenDer **Crawler** sucht nach Dokumentenextrahiert ihren Text und speichert diesen ​in einem **Suchindex**. Mit Hilfe dieses Indexes kann die **Suchmaske** Suchanfragen von Benutzern sehr schnell beantwortenUm den Suchindex zu schreiben und zu nutzen verwendet ​regain ​eine Bibliothek namens ​**Lucene**.
  
-The most important components of regain are: +[[http://​lucene.apache.org/​|Lucene]] verwaltet sehr effizient Suchindizes für große Datenmengen. Lucene ​bietet lediglich eine Programmierschnittstelle (API) um einen solchen Suchindex zu erzeugen und darin zu suchenWas in den Index rein soll, oder wann was gesucht werden soll, muss durch ein anderes Programm bestimmt werdenZum Beispiel regain.
-  * [[:components:​crawler]] - It searches for documents and extracts their text using the [[:​components:​preparator]]s. +
-  * [[:​components:​search index]] - The search index is bunch of files which are used by Lucene ​for answering search queries. +
-  * [[:components:​search mask]] - The search mask shows a web user interface to the user where he can enter search queries and browse through the results. The web pages are rendered using [[:​components:​the search mask jsp pages]].+
  
-  ​ +Die wichtigsten Komponenten von regain sind: 
-   +  ​* [[:​de:​components:​Crawler]] - Er sucht nach Dokumenten un extrahiert deren Text mit Hilfe der [[:​de:​components:​preparator|Präparatoren]]. 
----------------------+  * [[:​de:​components:​search index|Suchindex]] ​Der Suchindex ist eine Sammlung von Dateien, welche von Lucene dazu verwendet werden, Suchanfragen zu beantworten. 
 +  * [[:​de:​components:​search mask|Suchmaske]] ​Die Suchmaske zeigt dem Benutzer eine Web-Oberfläche,​ in die er Suchanfragen eingeben und die Suchergebnisse betrachten kann. Die Webseiten werden Hilfe der [[:​de:​components:​search mask jsp pages|JSP-Seiten der Suchmaske]] erstellt.
  
- 
-[http://​lucene.apache.org/​ Lucene] ist eine hocheffiziente Verwaltung eines Suchindexes für große Datenmengen unter [http://​www.java.com/​de/​about/​ Java] und bietet lediglich eine Programmierschnittstelle (API). ​ 
-**regain** nutzt u.a. diese Lucene-Bibliothek/​API und realisiert damit eine komplette, anfrageorientierte Suchmaschine (wie z.B. Google). Die Hauptkomponenten sind: 
-  * [[Crawler]] (zum Anlegen des [[Suchindex]]) und 
-  * [[Web-Oberfläche]] (u.a. [[Suchmaske]] zum Abfragen von Informationen aus dem Index) sowie 
-  * [[Server]] (zum Ausliefern der Suchergebnisse sowie der Web-Oberfläche an den Browser) 
- 
- 
- 
-Mehr zu den **regain**[[Vergleich_der_regain-Varianten|-Varianten]] bzw. die wichtigsten [[Features|Features]] 
- 
- 
-Andere Projekte: 
-[http://​incubator.apache.org/​solr/​index.html Solr] 
-[http://​lucene.apache.org/​nutch/​about.html nutch] 
- 
-  ​ 
de/components.1236084553.txt.gz · Zuletzt geändert: 2024/09/18 08:31 (Externe Bearbeitung)