2 コンテンツ・キャプチャ・プロセスの理解

コンテンツのキャプチャおよびOracle Content Managementへのアップロードの基本的なプロセスを見てみましょう。

ドキュメントの処理を最初から最後まで示しています

ソース

コンテンツは、様々なソースからキャプチャできます:

プロセッサ

ソースに関係なく、キャプチャされた各ドキュメントは数々のプロセッサを介した後、Oracle Content Managementにアップロードされて格納されたり、さらに処理されたりします:
  • インポート・プロセッサでは、ファイル・システム・フォルダ、区切り記号付きリストのテキスト・ファイル、または電子メール・サーバー・アカウントの受信ボックス/フォルダなどのソースから自動一括インポートできます。インポート・ジョブはソースをモニターし、指定された頻度で(1分、1時間または1日に1回)コンテンツをインポートします。

  • TIFF変換プロセッサでは、イメージ以外のドキュメントおよび添付をTIFFまたはJPEG形式に自動的に変換します。変換時に様々な方法でドキュメントと添付をマージするよう選択できます。たとえば、変換プロセッサは、バー・コード処理用にPDFやMicrosoft Officeドキュメントなどのドキュメント・ファイルをTIFFイメージに変換できます。

  • PDF変換プロセッサでは、ドキュメント、イメージおよび添付をPDFに変換します。
  • 認識プロセッサでは、自動的にバー・コードを認識し、ドキュメントを編成して索引を付けます。

  • コミット・プロセッサでは、コミット・プロファイルを実行して、バッチ内のドキュメントをOracle Content Managementに自動的に出力およびアップロードしてから、バッチをプロシージャから削除します。

    コミット・プロファイルには、ドキュメントとそのメタデータの出力方法が指定され、メタデータ・フィールドのマッピング、出力形式、エラー処理手順、およびコミット・ドライバ設定が含まれます。

  • アセット・ルックアップ・プロセッサでは、クライアント・ユーザーがOracle Content Managementリポジトリでサポートされているアセットを検索できます。

  • XML変換プロセッサでは、クライアント・ユーザーがXMLドキュメントをXSLTファイルに基づいた目的のスタイルに変換できます。

各プロセッサは、それらすべてが使用されるように構成されている場合、他のプロセッサと連携して動作します。バッチ・フロー内の多くのタスクは、インポート・プロセッサから始まり、構成されている形式にドキュメントを変換するためにPDFまたはTIFF変換プロセッサに渡されます。その後、バー・コードの認識、指定された方法でのドキュメントの編成、および索引付けのために認識プロセッサに引き継がれます。最後に、コミット・プロセッサが出力をOracle Content Managementに提供(アップロード)します。

キャプチャされたすべてのドキュメントは、コンテンツ・キャプチャ・プロセスで割り当てられたメタデータとともに、個別のコンテンツ・アイテムとしてOracle Content Managementにアップロードおよび格納されます。これらのアイテムは他のアイテムと同様にOracle Content Managementでアクセスおよび管理できます。

プロシージャ

プロシージャは、最初のソーシングから最終的なOracle Content Managementへのアップロードまでが定義されたコンテンツ・キャプチャ・ワークフローです。 各プロシージャは、特定の環境のメタデータ、処理ルール、構成プロファイルおよびバッチ・データを構成するための一元的な場所を提供する完全なコンテンツ・キャプチャ・システムです。コンテンツ・キャプチャ・クライアント・ユーザーは、アクセス権が付与されたプロシージャ内でバッチを作成したり、アクセスします。

組織に複数のプロシージャを作成することで、コンテンツ・キャプチャおよび処理のあらゆるニーズ(部門別、場所別など)を効率的に管理できます。また、最適な再利用のために、複数のプロシージャ間で共通の構成要素を共有することもできます。また、プロシージャをコピーして他の環境に簡単に適応させることもできます。

バッチ

バッチには1つ以上のドキュメントが含まれており、ドキュメントどうしに関連がある(たとえば、1人の顧客に複数のドキュメントがある)場合も、関連がない(たとえば、ドキュメントがセパレータ・シートで区切られている)場合もあります。
  • ドキュメントは、スキャンされたイメージや、Microsoft WordまたはPDFファイルなどの電子ファイルで構成されます。

  • ドキュメントには、イメージや電子ファイルなどの添付が含まれていることも、含まれていないこともあります。

バッチを操作するときは、それをロックできます。自分または別のユーザーがバッチをロックしている場合には、ロック・アイコンが表示されます。バッチをリリースすると、ロック・アイコンが削除され、クライアント・プロファイル設定に従って、別のユーザーまたはシステム・プロセッサが作業できるようにバッチが解放されます。

クライアント・プロファイル

プロシージャ・マネージャが定義したクライアント・プロファイルを使用して、バッチ内のページのグループをスキャンまたはインポートします。クライアント・プロファイルは、バッチ内のドキュメントのスキャン、インポートまたは索引付けの方法を決定する設定のグループです。クライアント・プロファイルで行われる処理は次のとおりです:
  • スキャナの設定、バッチ内のドキュメントの作成方法と分割方法、メタデータ・フィールドが使用可能かどうか、バー・コードが処理されるかどうかとその方法、およびバッチをリリースした後にバッチに対して行われる処理などが制御されます。

  • ドキュメントがキャプチャされるのみか、ドキュメントがキャプチャされて索引付けされるか、ドキュメントが索引付けされるのみかが決まります。

  • イメージ以外の電子ファイル(PDFドキュメントなど)が元の形式で保持されるか、イメージ形式に変換されるか、またはインポートされないかが決まります。

  • 選択したドキュメントに対して入力するメタデータ・フィールド・セットが識別されます。

クライアント・プロファイルに索引付けが含まれている場合、顧客IDや名前などのメタデータ値をドキュメントに割り当てることができます。通常、バッチ内の異なるタイプのドキュメントには、異なるメタデータ・フィールド・セットを使用できます。索引のみのバッチのドキュメントにメタデータ値を割り当てることはできますが、ページを追加、挿入または置換することはできません。

バッチ内のドキュメントの作業が完了したら、バッチをリリースします。これにより、排他的使用からロックが解除されます(リリース・プロセスが定義されていない場合)。使用可能なリリース・プロセスを選択してバッチをリリースした場合、バッチで実行される次のアクションは、そのリリース・プロセスによって異なります。次に実行される処理は、クライアント・プロファイル設定によって異なります。
  • バッチは、バッチ・ペインのリストから削除されてOracle Content Managementにコミットされたり、PDF/TIFF変換やバー・コード認識などの他の処理のためにキューに入れられたりする場合があります。

  • バッチはリストに残る場合もありますが、ロックは解除されます(ロック・アイコンは表示されません)。これによって、自分または別のユーザーがバッチをロックして、別の変更を追加できるようになります。