parse-plugins.xmlファイル

parse-plugins.xmlファイルは、MIMEタイプとパーサーのマッピングを提供します。

mime-types.xmlファイルには次の2つの目的があります。 このファイルの名前は、default.xml構成ファイル内のparse.plugin.fileプロパティによってWeb Crawlerに指定します。
次のエントリはこのファイルに設定されているものであり、解析規則がどのように設定されているかを示します。
<mimeType name="text/xml">
   <plugin id="parse-html" />
   <plugin id="endeca-searchexport-converter-parser" />
</mimeType>
このエントリでは、text/xml MIMEタイプに対して最初にHtmlParserプラグインが呼び出されます。このプラグインが正常終了すると、解析は完了します。このプラグインが正常に終了しなかった場合は、次にendeca-searchexport-converter-parserプラグインが呼び出されます。
次のエントリに注目してください。
<mimeType name="*">
   <plugin id="endeca-searchexport-converter-parser" />
</mimeType>
このエントリは、一致する項目のなかったすべてのMIMEタイプに対してはendeca-searchexport-converter-parserプラグインを呼び出すように指示するものです。

一般的には、独自のパーサー・プラグインを作成した場合を除き、このファイルの内容は変更しないことをお薦めします。