サンプル・ドキュメント・ディレクトリ・データソースは、BinaryContentFileProviderインタフェースの実装を示しています。このインタフェースでは、拡張機能がIAS Serverにファイルを渡し、テキスト抽出を実行できるようになります。拡張機能をIntegrator Acquisition Systemにインストール後、サンプル・ドキュメント・ディレクトリ・データソースを構成して実行できます。
サンプル・ドキュメント・ディレクトリ・データソースを実行する手順は次のとおりです。
たとえば、fileSystemCrawl.xmlをコピーして、sampleDocDir.xmlとして<インストール・パス>\IAS\<バージョン>\sample\crawlConfigFilesに保存します。
オプション | 説明 |
---|---|
crawlId | IASでクロールとその他のものを区別する一意の名前を指定します。たとえば、sampleDocDirなどです。 |
moduleId | ドキュメント・ディレクトリ・データソースのモジュールIDを指定します。この値はcom.endeca.ias.extension.sample.datasource.directory.DirectoryDataSourceに設定する必要があります。 |
オプション | 説明 |
---|---|
documentDirectory | ドキュメントへのパスを指定します。<インストール・パス>\IAS\<バージョン>\sample\ias-extensions\data\documents |
... <sourceConfig> <moduleId> <id>com.endeca.ias.extension.sample.datasource.directory.DirectoryDataSource</id> </moduleId> <moduleProperties> <moduleProperty> <key>documentDirectory</key> <value>C:\Oracle\Endeca\IAS\3.1.0\sample\ias-extensions\data\documents</value> </moduleProperty> </moduleProperties> <excludeFilters /> <includeFilters /> </sourceConfig> ...
オプション | 説明 |
---|---|
moduleId | クロールの出力タイプを指定します。Record Storeのidを指定します。 |
host | レコード・ストア・インスタンスを実行するホストの完全修飾名を指定します。デフォルト値はlocalhostです。 |
port | レコード・ストア・インスタンスを実行するEndeca IAS Serviceのポートを指定します。デフォルト値は8401です。 |
contextPath | IASをWebLogic Serverにインストールし、デフォルトのWebLogicコンテキスト・パスを変更した場合、スラッシュを含めずに変更されたコンテキスト・パスを指定します。WebLogic Serverのインストールでは、contextPathのデフォルト値はias-serverとなります。IASをJettyにインストールした場合、contextPathを削除するか、空の値を指定します。
たとえば、次のようになります。 <moduleProperty> <key>contextPath</key> <value>ias-server</value> </moduleProperty> |
... <outputConfig> <moduleId> <id>Record Store</id> </moduleId> <moduleProperties> <moduleProperty> <key>host</key> <value>mymachine.endeca.com</value> </moduleProperty> <moduleProperty> <key>port</key> <value>8401</value> </moduleProperty> </moduleProperties> </outputConfig> ...
C:\Oracle\Endeca\IAS\3.1.0\bin>ias-cmd.bat createCrawls -f C:\Oracle\Endeca\IAS\ 3.1.0\sample\crawlConfigFiles\sampleDocDir.xml Created crawl sampleDocDir
C:\Oracle\Endeca\IAS\3.1.0\bin>ias-cmd.bat startCrawl -id sampleDocDir
C:\Oracle\Endeca\IAS\3.1.0\bin>recordstore-cmd.bat read-baseline -a sampleDocDir -c Records read: 5
Oracle Endeca Information Discovery Integrator Integrator Acquisition System拡張APIガイド · リリース3.1.0 · 2013年10月
Copyright ©2003, 2013,Oracle and/or its affiliates. All rights reserved.