場合によっては、出力をレコード・ストア・インスタンスではなくファイルに書き込むようにクロールを再構成できます。たとえば、追加処理の前にXMLの出力を調べる場合や、出力をレコード・ストアではなくバージョン・コントロール・システムに格納する場合などに役立ちます。
手順では、File Systemに<moduleId>を指定する<outputConfig>設定を含むクロール構成ファイルが必要です。それ以外の<outputConfig>のサブ要素は、出力ファイル自体に関する追加構成(圧縮を有効にするかどうか、ファイルの接頭辞名、出力ファイルのパスなど)になります。
ファイルにクロール出力を書き込むには:
| オプション | 説明 |
|---|---|
| moduleId | (必須)。File Systemのidを指定します。 |
| outputXml | (オプション)。XMLとバイナリのどちらでレコードを書き込むかを指定します。値がtrueの場合、レコードの単一XML出力ファイルが作成されます。値がfalseの場合、レコードのバイナリ・ファイルが作成されます。デフォルト値はfalseです。 |
| outputCompressed | (オプション)。出力ファイルを圧縮するかどうかを指定します。trueを指定すると、出力が圧縮されます。デフォルトはtrueです。 |
| outputPrefix | (オプション)。ファイル名に出力接頭辞を指定します。デフォルトの接頭辞はCrawlerOutputです。 |
| outputDirectory | (オプション)。outputDirectoryを使用して、出力ファイルの出力ディレクトリを指定します。
outputDirectoryのデフォルト値はoutputです。crawlIDのデフォルト名は、各クロールのサブディレクトリの作成に使用されます。 これにより、各クロールの出力に一意のサブディレクトリが作成されます。たとえば、outputDirectoryのデフォルト値を使用し、FileSystemCrawlにcrawlIDがある場合、結果として作成されるディレクトリ構造は\IASServerWorkspace\output\FileSystemCrawl\になります。 Windowsでの構文例: C:\Oracle\Endeca\IAS\workspace\output\FileSystemCrawl |
<?xml version="1.0" encoding="UTF-8"?>
<configurations xmlns="http://endeca.com/eidi/ias/2011-12">
<crawlConfig>
...
<outputConfig>
<moduleId>
<id>File System</id>
</moduleId>
<moduleProperties>
<moduleProperty>
<key>outputXml</key>
<value>true</value>
</moduleProperty>
<moduleProperty>
<key>outputCompressed</key>
<value>false</value>
</moduleProperty>
<moduleProperty>
<key>outputPrefix</key>
<value>CrawlerOutput</value>
</moduleProperty>
<moduleProperty>
<key>outputDirectory</key>
<value>C:\Oracle\Endeca\IAS\workspace\output\FileSystemCrawl</value>
</moduleProperty>
</moduleProperties>
</outputConfig>
</crawlConfig>
</configurations>