urlfilter.orderプロパティを使用して、URLフィルタが適用される順序を指定できます。
このプロパティの値が空だと、利用可能なすべてのURLフィルタ(plugin-includesプロパティとplugin-excludesプロパティによって決定される)がロードされ、システム定義の順序で適用されます。このプロパティが空でない場合は、このプロパティに記載されているフィルタのみがロードされ、指定されている順序で適用されます。
URLフィルタの順序を設定するには:
org.apache.nutch.urlfilter.regex.RegexURLFilter sample.project.urlfilter.sample.SampleFilterこの場合、最初にRegexURLFilterが適用され、次にSampleFilterが適用されます。
すべてのフィルタはAND演算によって連結されるため、フィルタの順序が最終的な結果に影響を及ぼすことはありません。ただし、フィルタの相対的な処理コストの違いから、パフォーマンス上の違いが生じる場合があります。