Oracle WebCenter Interaction Web サービス開発ガイド

        前  次  新しいウィンドウで目次を開く     
ここから内容の開始

コンテンツ クローラについて

コンテンツ クローラは、Lotus Notes、Microsoft Exchange、Documentum、Novell などのバックエンドのドキュメント リポジトリから、ポータル ディレクトリにドキュメントをインポートするために使用する、拡張可能なコンポーネントです。ポータル ユーザはアクセス制限に違反することなく、保護されたバックエンド システム上のクロールされたファイルをポータルから検索して開くことができます。

Oracle WebCenter Interaction Development Kit (IDK) では、SOAP を解析したり、ポータル API にアクセスしたりしなくても、リモート コンテンツ クローラとそれに関連するコンフィグレーション ページを作成できます。バックエンド リポジトリにアクセスしてファイルを取得する 4 つのオブジェクト インタフェースを実装するだけです。UDDI サービスは必要ありません。

コンテンツ クローラの目的は 2 つあります。


  1. 階層的なデータ リポジトリを反復処理してカタログ化します。メタデータを取得して、データ リポジトリ内のドキュメントをインデックス設定し、それらをポータル ディレクトリと検索インデックスに含めます。ファイルはメタデータとフルテキスト コンテンツに基づいてインデックス設定されます。
  2. ポータル ディレクトリから個別のドキュメントをオンデマンドで取得します。このとき、ユーザ レベルのアクセス制限を課します。

コンテンツ クローラは、ポータルの Automation Service によって非同期的に実行されます。関連付けられているコンテンツ クローラが手順 1 を完了します。更新されたファイルや追加されたファイルを反映するために、コンテンツ クローラ ジョブを定期的に実行することができます。ポータルは、クロールされたファイルごとにドキュメント オブジェクトを作成して、ディレクトリ内でインデックス設定します。各オブジェクトには、基本的なファイル情報、セキュリティ情報、およびバックエンドのコンテンツ リポジトリからファイルを開くための URL が含まれています (ポータル サーバ上にはクロールされたファイルは格納されません)。コンテンツがファイル内に含まれていない場合や別の理由でインデックス設定できない場合は、インデックス設定可能なファイルをポータルに返すためのサーブレット/aspx ページを実装する必要があります。

手順 2 は、ユーザがディレクトリを参照して、以前にクロールされたドキュメントを開くときに発生します。ファイルがポータルにクロールされると、ユーザはリンクをクリックして、ポータル内からそのファイルにアクセスできるようになります。この手順は「クリックスルー」と呼ばれます。ファイルが公的にアクセス可能である場合、クリックスルーは簡単です。ほとんどの場合、ファイアウォールの背後にあるドキュメントへのアクセスを提供し、それ以外の場合はポータル インタフェースからアクセスできないようにする必要があります。

詳細については、以下のトピックを参照してください。

  ページの先頭            前  次