plugin.xmlファイルでは、Web Crawlerに対するプラグインについて説明します。このファイルは、JARファイルとともにプラグイン・ディレクトリにあります。
<?xml version="1.0" encoding="UTF-8"?> <plugin id="filter-htmlmetatags" name="" version="1.0" provider-name="com.endeca.eidi.web"> <runtime> <library name="filter-htmlmetatags.jar"> <export name="*"/> </library> </runtime> <requires> <import plugin="nutch-extensionpoints"/> </requires> <extension id="com.endeca.eidi.web.parse.HTMLMetatagFilter" name="HTML Metatag filter" point="org.apache.nutch.parse.ParseFilter"> <implementation id="filter-htmlmetatags" class="com.endeca.eidi.web.parse.HTMLMetatagFilter"> </implementation> </extension> </plugin>このファイルで、JARの名前(filter-htmlmetatags.jar)、拡張ポイントの名前(ParseFilter)および実装クラスの名前(HTMLMetatagFilter)を定義します。また、(<plugin id>属性を使用して)プラグインIDを設定し、後述するようにこのIDを構成ファイルで設定します。