クロール構成の取得

IasCrawler.getCrawlConfig()メソッドをコールして、クロールの構成設定を取得します。

このメソッドの構文は、次のとおりです。
IasCrawler.getCrawlConfig(CrawlId crawlId, Boolean fillInDefaults)
各要素の意味は次のとおりです。
  • crawlIdは、構成を返すクロールの名前を含むCrawlIdオブジェクトです。
  • fillInDefaultsは、trueに設定されている場合、指定されていない設定にデフォルト値を入力するブール・フラグです。設定がパスワードである場合、trueは、値ではなく名前を返します。フラグがfalseに設定されている場合、いずれの設定の値も変更されません。

パスワード・プロパティにModulePropertyを含むクロール構成を取得する場合、クロール構成は、長さゼロのリストとして値を取得します。

メソッドは、次を含むCrawlConfigオブジェクトを返します。
  • sourceConfig - シード、フィルタ、およびコンテンツの取得元となるシステムまたはネイティブ・ファイル・システムのファイル・プロパティをファイル・システム・クロールのために取得するかどうかに関する特定の情報を含むSourceConfigオブジェクト。
  • manipulatorConfig - ManipulatorConfigオブジェクトのリスト。各ManipulatorConfigは、特定のクロールで実行される操作を指定します。
  • textExtractionConfig - テキスト抽出を有効化するかどうかや再試行数などのテキスト抽出オプションを含むTextExtractionConfigオブジェクト。
  • outputConfig - レコードをレコード・ストア・インスタンスまたはレコード出力ファイルに書き込むかどうか、出力ディレクトリのパスおよび出力フォーマット(バイナリまたはXML)などの出力オプションを含むOutputConfigオブジェクト。
  • crawlthreads - クロール当たりのスレッド数を示すプロパティ。
  • loggingLevel - ロギング・レベルを示すプロパティ。

クロールの構成設定を取得するには:

  1. IAS Serverへの接続が作成されていることを確認します。(この例では、crawlerという名前のIasCrawlerオブジェクトが使用されます。)
  2. 最初にCrawlIdオブジェクトをインスタンス化し、次にそのIDを設定して、クロールの名前を設定します。
    たとえば、次のようになります。
    // Create a new crawl Id with the name set to Demo.
    CrawlId crawlId = new CrawlId("Demo");
  3. クロールIDおよびデフォルト設定のブール・フラグを指定してIasCrawler.getCrawlConfig()メソッドをコールします。
    たとえば、次のようになります。
    CrawlConfig crawlConfig = crawler.getCrawlConfig(crawlId, true);
  4. アプリケーションの要件に従って、返されたCrawlConfigを処理します。

指定したクロール(crawlIdパラメータ)が存在しないか見つからない場合、IasCrawler.getCrawlConfig()メソッドによりCrawlNotFoundExceptionが発生します。例外を捕捉するには、tryブロックを使用し、適切なcatch句を指定します。