====== Unterschiede ====== Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
de:components [2009/03/03 13:49] 127.0.0.1 Externe Bearbeitung |
de:components [2024/09/18 08:31] (aktuell) |
||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ====== The main components of regain ====== | + | ====== Die wichtigsten Komponenten von regain ====== |
- | The basic job done by regain is: The **crawler** searches for documents, extracts their text and stores it in a **search index**. Using this index, the **search mask** can answer search queries from users in nearly no time. For writing and using the search index, regain is using a library called **Lucene**. | + | Grob betrachtet arbeitet regain folgendermaßen: Der **Crawler** sucht nach Dokumenten, extrahiert ihren Text und speichert diesen in einem **Suchindex**. Mit Hilfe dieses Indexes kann die **Suchmaske** Suchanfragen von Benutzern sehr schnell beantworten. Um den Suchindex zu schreiben und zu nutzen verwendet regain eine Bibliothek namens **Lucene**. |
- | The most important components of regain are: | + | [[http://lucene.apache.org/|Lucene]] verwaltet sehr effizient Suchindizes für große Datenmengen. Lucene bietet lediglich eine Programmierschnittstelle (API) um einen solchen Suchindex zu erzeugen und darin zu suchen. Was in den Index rein soll, oder wann was gesucht werden soll, muss durch ein anderes Programm bestimmt werden: Zum Beispiel regain. |
- | * [[:components:crawler]] - It searches for documents and extracts their text using the [[:components:preparator]]s. | + | |
- | * [[:components:search index]] - The search index is bunch of files which are used by Lucene for answering search queries. | + | |
- | * [[:components:search mask]] - The search mask shows a web user interface to the user where he can enter search queries and browse through the results. The web pages are rendered using [[:components:the search mask jsp pages]]. | + | |
- | | + | Die wichtigsten Komponenten von regain sind: |
- | + | * [[:de:components:Crawler]] - Er sucht nach Dokumenten un extrahiert deren Text mit Hilfe der [[:de:components:preparator|Präparatoren]]. | |
- | --------------------- | + | * [[:de:components:search index|Suchindex]] - Der Suchindex ist eine Sammlung von Dateien, welche von Lucene dazu verwendet werden, Suchanfragen zu beantworten. |
+ | * [[:de:components:search mask|Suchmaske]] - Die Suchmaske zeigt dem Benutzer eine Web-Oberfläche, in die er Suchanfragen eingeben und die Suchergebnisse betrachten kann. Die Webseiten werden Hilfe der [[:de:components:search mask jsp pages|JSP-Seiten der Suchmaske]] erstellt. | ||
- | |||
- | [http://lucene.apache.org/ Lucene] ist eine hocheffiziente Verwaltung eines Suchindexes für große Datenmengen unter [http://www.java.com/de/about/ Java] und bietet lediglich eine Programmierschnittstelle (API). | ||
- | **regain** nutzt u.a. diese Lucene-Bibliothek/API und realisiert damit eine komplette, anfrageorientierte Suchmaschine (wie z.B. Google). Die Hauptkomponenten sind: | ||
- | * [[Crawler]] (zum Anlegen des [[Suchindex]]) und | ||
- | * [[Web-Oberfläche]] (u.a. [[Suchmaske]] zum Abfragen von Informationen aus dem Index) sowie | ||
- | * [[Server]] (zum Ausliefern der Suchergebnisse sowie der Web-Oberfläche an den Browser) | ||
- | |||
- | |||
- | |||
- | Mehr zu den **regain**[[Vergleich_der_regain-Varianten|-Varianten]] bzw. die wichtigsten [[Features|Features]] | ||
- | |||
- | |||
- | Andere Projekte: | ||
- | [http://incubator.apache.org/solr/index.html Solr] | ||
- | [http://lucene.apache.org/nutch/about.html nutch] | ||
- | |||
- | |