サンプルWebクロールを実行して、Web Crawlerの構成と動作を確認できます。サンプルは<install path>\IAS\workspace\conf\web-crawler\polite-crawlディレクトリにあります。
このサンプルは、<install path>\IAS\workspace\conf\web-crawler\defaultディレクトリにある事前構成済のシード・ファイル(endeca.lst)を使用して、http://www.oracle.comをクロールします。
このサンプル・クロールは、非圧縮のXMLとしてレコードを出力するように構成されています。XMLフォーマットを利用することによって、出力ファイルを簡単に参照でき、クロールによって収集されたレコードを確認できます。また、site.xmlファイルには、ワークスペース・ディレクトリ名としてpolite-crawl-workspaceが指定されています。
サンプル・クロールを実行するには:
完了すると、クロール完了と表示されます。<install path>\IAS\<version>\bin\polite-crawl-workspace\outputディレクトリに、polite-crawl.xmlという名前の出力ファイルが作成されます。