パーサー・フィルタのプロパティ

default.xmlファイル内に、パーサー・フィルタに関するプロパティを設定します。

Web Crawlerには、クローラのタスクにおいて中心となる処理を実行するためのフィルタ・プラグインがいくつか含まれています。次の表に記載されているプロパティを使用して、Web Crawlerがそれらのプラグインを扱う方法を構成できます。
プロパティ名 プロパティの値
parser.filters.order パーサー・フィルタ・クラスの名前の空白区切りリストです(デフォルトは空)。パーサー・フィルタが適用される順序を指定します。
document.prune.xpath XPath式の文字列です(デフォルトは空)。endeca-xpath-filterで使用されるXPath式を定義します。
document.prune.xpath.follow-outlinks ブール値です(デフォルトはtrue)。クローラがプルーニングされたコンテンツからの外部リンクを追跡するかどうかを指定します。true(デフォルト)に設定されると、外部リンクが追跡されます。
注意: この機能を使用するには、plugin.includesプロパティにendeca-xpath-filterを含める必要があります。