plugin.xmlファイルの概要

plugin.xmlファイルでは、Web Crawlerに対するプラグインについて説明します。このファイルは、JARファイルとともにプラグイン・ディレクトリにあります。

HTMLMetatagFilterプロジェクトに付属するplugin.xmlファイルは、次のとおりです。
<?xml version="1.0" encoding="UTF-8"?>
<plugin
id="filter-htmlmetatags"
name=""
version="1.0"
provider-name="com.endeca.eidi.web">
<runtime>
<library name="filter-htmlmetatags.jar">
<export name="*"/>
</library>
</runtime>
<requires>
<import plugin="nutch-extensionpoints"/>
</requires>
<extension id="com.endeca.eidi.web.parse.HTMLMetatagFilter"
name="HTML Metatag filter"
point="org.apache.nutch.parse.ParseFilter">
<implementation id="filter-htmlmetatags"
class="com.endeca.eidi.web.parse.HTMLMetatagFilter">
</implementation>
</extension>
</plugin>
このファイルで、JARの名前(filter-htmlmetatags.jar)、拡張ポイントの名前(ParseFilter)および実装クラスの名前(HTMLMetatagFilter)を定義します。また、(<plugin id>属性を使用して)プラグインIDを設定し、後述するようにこのIDを構成ファイルで設定します。