Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:components
Übersetzungen dieser Seite:

**Dies ist eine alte Version des Dokuments!** ----

A PCRE internal error occured. This might be caused by a faulty plugin

====== The main components of regain ====== The basic job done by regain is: The **crawler** searches for documents, extracts their text and stores it in a **search index**. Using this index, the **search mask** can answer search queries from users in nearly no time. For writing and using the search index, regain is using a library called **Lucene**. The most important components of regain are: * [[:components:crawler]] - It searches for documents and extracts their text using the [[:components:preparator]]s. * [[:components:search index]] - The search index is bunch of files which are used by Lucene for answering search queries. * [[:components:search mask]] - The search mask shows a web user interface to the user where he can enter search queries and browse through the results. The web pages are rendered using [[:components:the search mask jsp pages]]. --------------------- [http://lucene.apache.org/ Lucene] ist eine hocheffiziente Verwaltung eines Suchindexes für große Datenmengen unter [http://www.java.com/de/about/ Java] und bietet lediglich eine Programmierschnittstelle (API). **regain** nutzt u.a. diese Lucene-Bibliothek/API und realisiert damit eine komplette, anfrageorientierte Suchmaschine (wie z.B. Google). Die Hauptkomponenten sind: * [[Crawler]] (zum Anlegen des [[Suchindex]]) und * [[Web-Oberfläche]] (u.a. [[Suchmaske]] zum Abfragen von Informationen aus dem Index) sowie * [[Server]] (zum Ausliefern der Suchergebnisse sowie der Web-Oberfläche an den Browser) Mehr zu den **regain**[[Vergleich_der_regain-Varianten|-Varianten]] bzw. die wichtigsten [[Features|Features]] Andere Projekte: [http://incubator.apache.org/solr/index.html Solr] [http://lucene.apache.org/nutch/about.html nutch]

de/components.1236084553.txt.gz · Zuletzt geändert: 2024/09/18 08:31 (Externe Bearbeitung)