====== Unterschiede ====== Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
de:features:white_and_black_list [2009/03/03 13:49] 127.0.0.1 Externe Bearbeitung |
de:features:white_and_black_list [2024/09/18 08:32] (aktuell) |
||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ====== Weiße und Schwarze Liste ====== | + | ====== White List und Black List ====== |
- | Mit Hilfe der **Weißen und Schwarzen Liste** können Sie sehr genau einstellen, was in den Index kommen soll und was nicht. | + | Mit Hilfe der **White List** und der **Black List** können Sie sehr genau einstellen, was in den Index kommen soll und was nicht. |
- | Die Grundregel dabei ist immer: Ein Dokument kommt in den Index, wenn seine URL mindestens einem Eintrag der Weißen Liste, aber keinem Eintrag aus der Schwarzen Liste entspricht. | + | Die Grundregel dabei ist immer: Ein Dokument kommt in den Index, wenn seine URL mindestens einem Eintrag der White List, aber keinem Eintrag aus der Black List entspricht. |
===== Wie kann ich dieses Feature nutzen? ===== | ===== Wie kann ich dieses Feature nutzen? ===== | ||
- | Die Listen werden in der [[CrawlerConfiguration.xml]] durch die Tags ''<whitelist>'' bzw. ''<blacklist>'' definiert. | + | Die Listen werden in der [[:config:CrawlerConfiguration.xml]] durch die Tags ''<whitelist>'' bzw. ''<blacklist>'' definiert. |
Die folgende Konfiguration bestimmt beispielsweise, dass alle URLs aufgenommen werden, die mit ''<nowiki>http://www.mydomain.de</nowiki>'' beginnen, außer diejenigen aus ''<nowiki>http://www.mydomain.de/some/dynamic/content/</nowiki>'': | Die folgende Konfiguration bestimmt beispielsweise, dass alle URLs aufgenommen werden, die mit ''<nowiki>http://www.mydomain.de</nowiki>'' beginnen, außer diejenigen aus ''<nowiki>http://www.mydomain.de/some/dynamic/content/</nowiki>'': | ||
- | <whitelist> | + | |
- | <prefix><nowiki>http://www.mydomain.de</nowiki></prefix> | + | <code xml> |
- | </whitelist> | + | <whitelist> |
- | <blacklist> | + | <prefix>http://www.mydomain.de</prefix> |
- | <prefix><nowiki>http://www.mydomain.de/some/dynamic/content/</nowiki></prefix> | + | </whitelist> |
- | </blacklist> | + | |
+ | <blacklist> | ||
+ | <prefix>http://www.mydomain.de/some/dynamic/content/</prefix> | ||
+ | </blacklist> | ||
+ | </code> | ||