場合によっては、出力をレコード・ストア・インスタンスではなくファイルに書き込むようにクロールを再構成できます。たとえば、追加処理の前にXMLの出力を調べる場合や、出力をレコード・ストアではなくバージョン・コントロール・システムに格納する場合などに役立ちます。
手順では、File Systemに<moduleId>を指定する<outputConfig>設定を含むクロール構成ファイルが必要です。それ以外の<outputConfig>のサブ要素は、出力ファイル自体に関する追加構成(圧縮を有効にするかどうか、ファイルの接頭辞名、出力ファイルのパスなど)になります。
ファイルにクロール出力を書き込むには:
オプション | 説明 |
---|---|
moduleId | (必須)。File Systemのidを指定します。 |
outputXml | (オプション)。XMLとバイナリのどちらでレコードを書き込むかを指定します。値がtrueの場合、レコードの単一XML出力ファイルが作成されます。値がfalseの場合、レコードのバイナリ・ファイルが作成されます。デフォルト値はfalseです。 |
outputCompressed | (オプション)。出力ファイルを圧縮するかどうかを指定します。trueを指定すると、出力が圧縮されます。デフォルトはtrueです。 |
outputPrefix | (オプション)。ファイル名に出力接頭辞を指定します。デフォルトの接頭辞はCrawlerOutputです。 |
outputDirectory | (オプション)。outputDirectoryを使用して、出力ファイルの出力ディレクトリを指定します。
outputDirectoryのデフォルト値はoutputです。crawlIDのデフォルト名は、各クロールのサブディレクトリの作成に使用されます。 これにより、各クロールの出力に一意のサブディレクトリが作成されます。たとえば、outputDirectoryのデフォルト値を使用し、FileSystemCrawlにcrawlIDがある場合、結果として作成されるディレクトリ構造は\IASServerWorkspace\output\FileSystemCrawl\になります。 Windowsでの構文例: C:\Oracle\Endeca\IAS\workspace\output\FileSystemCrawl |
<?xml version="1.0" encoding="UTF-8"?> <configurations xmlns="http://endeca.com/eidi/ias/2011-12"> <crawlConfig> ... <outputConfig> <moduleId> <id>File System</id> </moduleId> <moduleProperties> <moduleProperty> <key>outputXml</key> <value>true</value> </moduleProperty> <moduleProperty> <key>outputCompressed</key> <value>false</value> </moduleProperty> <moduleProperty> <key>outputPrefix</key> <value>CrawlerOutput</value> </moduleProperty> <moduleProperty> <key>outputDirectory</key> <value>C:\Oracle\Endeca\IAS\workspace\output\FileSystemCrawl</value> </moduleProperty> </moduleProperties> </outputConfig> </crawlConfig> </configurations>