Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:features:white_and_black_list
Übersetzungen dieser Seite:

**Dies ist eine alte Version des Dokuments!** ----

A PCRE internal error occured. This might be caused by a faulty plugin

====== Weiße und Schwarze Liste ====== Mit Hilfe der **Weißen und Schwarzen Liste** können Sie sehr genau einstellen, was in den Index kommen soll und was nicht. Die Grundregel dabei ist immer: Ein Dokument kommt in den Index, wenn seine URL mindestens einem Eintrag der Weißen Liste, aber keinem Eintrag aus der Schwarzen Liste entspricht. ===== Wie kann ich dieses Feature nutzen? ===== Die Listen werden in der [[CrawlerConfiguration.xml]] durch die Tags ''&lt;whitelist&gt;'' bzw. ''&lt;blacklist&gt;'' definiert. Die folgende Konfiguration bestimmt beispielsweise, dass alle URLs aufgenommen werden, die mit ''<nowiki>http://www.mydomain.de</nowiki>'' beginnen, außer diejenigen aus ''<nowiki>http://www.mydomain.de/some/dynamic/content/</nowiki>'': <whitelist> <prefix><nowiki>http://www.mydomain.de</nowiki></prefix> </whitelist> <blacklist> <prefix><nowiki>http://www.mydomain.de/some/dynamic/content/</nowiki></prefix> </blacklist>

de/features/white_and_black_list.1236084557.txt.gz · Zuletzt geändert: 2024/09/18 08:32 (Externe Bearbeitung)