Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:features:white_and_black_list
Übersetzungen dieser Seite:

====== White List und Black List ====== Mit Hilfe der **White List** und der **Black List** können Sie sehr genau einstellen, was in den Index kommen soll und was nicht. Die Grundregel dabei ist immer: Ein Dokument kommt in den Index, wenn seine URL mindestens einem Eintrag der White List, aber keinem Eintrag aus der Black List entspricht. ===== Wie kann ich dieses Feature nutzen? ===== Die Listen werden in der [[:config:CrawlerConfiguration.xml]] durch die Tags ''<whitelist>'' bzw. ''<blacklist>'' definiert. Die folgende Konfiguration bestimmt beispielsweise, dass alle URLs aufgenommen werden, die mit ''<nowiki>http://www.mydomain.de</nowiki>'' beginnen, außer diejenigen aus ''<nowiki>http://www.mydomain.de/some/dynamic/content/</nowiki>'': <code xml> <whitelist> <prefix>http://www.mydomain.de</prefix> </whitelist> <blacklist> <prefix>http://www.mydomain.de/some/dynamic/content/</prefix> </blacklist> </code>

de/features/white_and_black_list.txt · Zuletzt geändert: 2024/09/18 08:32 (Externe Bearbeitung)