Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:features:white_and_black_list
Übersetzungen dieser Seite:

White List und Black List

Mit Hilfe der White List und der Black List können Sie sehr genau einstellen, was in den Index kommen soll und was nicht.

Die Grundregel dabei ist immer: Ein Dokument kommt in den Index, wenn seine URL mindestens einem Eintrag der White List, aber keinem Eintrag aus der Black List entspricht.

Wie kann ich dieses Feature nutzen?

Die Listen werden in der CrawlerConfiguration.xml durch die Tags <whitelist> bzw. <blacklist> definiert.

Die folgende Konfiguration bestimmt beispielsweise, dass alle URLs aufgenommen werden, die mit http://www.mydomain.de beginnen, außer diejenigen aus http://www.mydomain.de/some/dynamic/content/:

<whitelist>
  <prefix>http://www.mydomain.de</prefix>
</whitelist>
 
<blacklist>
  <prefix>http://www.mydomain.de/some/dynamic/content/</prefix>
</blacklist>
de/features/white_and_black_list.txt · Zuletzt geändert: 2014/10/29 10:23 (Externe Bearbeitung)