Endeca Web Crawlerは、Apache Nutchオープンソース・プロジェクトに基づいています。そのため、主要な機能はプラグインとして実装されます。そのフレームワークによって、Webページからコンテンツを追加で抽出するプラグインなど、独自のプラグインを書き込むことができます。
サンプル・プラグインでは、Web Crawlerにカスタム・プラグインを統合する方法について説明します。Endeca Web Crawler APIには、独自のプラグイン作成に役立つサンプル・コードおよびドキュメントが含まれます。
すべてのプラグイン(デフォルト・プラグインおよびユーザー作成プラグインなど)は、IAS\<version>\lib\web-crawler\pluginsディレクトリにあります。個々のプラグイン・ディレクトリには、1つ以上のJARファイルおよびプラグイン・ディスクリプタ・ファイル(名前: plugin.xml)が含まれます。