Oracle WebCenter Captureは、プロセス指向のイメージング・アプリケーションやイメージ対応のエンタープライズ・アプリケーションを中心に、拡張性の高いドキュメント・キャプチャを提供します。集中環境および分散環境向けのWebインタフェースが用意されており、紙ドキュメントと電子ドキュメントのキャプチャ・プロセスを合理化できます。これは、完全にOracle WebCenter Content: ImagingおよびOracle WebCenter Contentと統合されており、非常に重要なビジネス・コンテンツをキャプチャ、保存、管理および取得できる1つのシステムを組織に提供します。
この章では、Oracle WebCenter Captureとその管理について概説します。内容は次のとおりです。
バッチおよびドキュメントは、WebCenter Captureでの作業の主要な要素です。Captureでは、ドキュメントはスキャンまたはインポートされてバッチ内に保存されます。バッチは、ドキュメントに編成されメタデータ(索引)値を割り当てられた、取り込まれたイメージまたは電子ドキュメント・ファイル(PDFやMicrosoft Officeファイル)で構成されます。各ドキュメントは、一連のメタデータ値を共有します。
WebCenter Captureには、次の主要なプロセスが関連しています。
キャプチャとは、Captureワークスペース内のバッチへドキュメントをスキャンして出力するか、インポートすることを意味します(第1.3項を参照)。ドキュメントを取得する一般的なシナリオは次のとおりです。
業務用ドキュメント・イメージング・スキャナを使用した大量のスキャン
ビジネス・アプリケーションなどからの一時的なリモート・スキャンまたはインポート
電子メールの受信トレイなどからの自動的なインポート
Captureでは次のドキュメント入力の方法が可能です。
ビジネス・シナリオによっては、Captureに入力する非イメージ・ドキュメントを別の形式に変換することが必要な場合があります。たとえば、ある組織ではインポートされた電子メール・メッセージに添付されたPDFの経費レポートをイメージ形式に変換して、バー・コードの読取りを可能にしています。Captureのドキュメント変換プロセッサは、ドキュメント変換ジョブに保存された設定を使用して、バッチ内のドキュメントを自動的に変換およびマージします。第6.1項を参照してください。
Captureでの分類は、バッチを論理的なドキュメントに分割し、それぞれのドキュメントに一連のメタデータ値を割り当てることを意味します。
分類は、手動または自動の様々な方法で実行できます。
ドキュメントの分割
ドキュメントの分割はいくつかの方法で実行できます。
ユーザーがCaptureクライアントで手動で実行。たとえば、ユーザーは、1ドキュメント当り数ページに構成されたクライアント・プロファイルを選択できます。また、新しいドキュメントを識別するスキャンの前に、ドキュメント間にセパレータ・シートを挿入できます。クライアント・ユーザーは、ドキュメントを視覚的に確認している間に、必要応じてドキュメント区切りを追加することもできます。
Captureクライアントでのファイルのインポート時にユーザーが手動で実行。
インポート・プロセッサによるインポート時にジョブ設定に従って自動的に実行。
認識プロセッサによるバー・コード認識時に自動的に実行。バッチが認識プロセッサに送信されると、バー・コード認識とドキュメント分類が自動的に実行されます。第7.1項を参照してください。
メタデータの割当て
Captureでは、ドキュメント・プロファイルに従ってドキュメントに一連のメタデータ値が割り当てられます。ドキュメント・プロファイルは、そのドキュメントのタイプに索引付けできるメタデータ・フィールドを特定します。メタデータデータ値は次のように割り当てることができます。
手動、ユーザーによりCaptureクライアントのメタデータ・ペインで
自動、インポート・プロセッサにより処理時にジョブ設定に基づいて
自動、認識プロセッサにより処理時にジョブ設定に基づいて
Captureでは、メタデータ・フィールドに様々な形式があり、選択リスト、依存選択リスト、データベース参照、自動入力フィールドおよび入力マスクと表示形式を持つフィールドなどがあります。ワークスペース・マネージャは、ワークスペースでこれらのメタデータ・フィールド定義を構成し、クライアント・プロファイルまたはプロセッサ・ジョブでそれらを使用します。第3.4項を参照してください。
Captureでは、後述のとおりロックおよびリリース・システムを使用して、バッチへ一度に1ユーザーまたは1つのプロセッサ・ジョブしかアクセスできないようにします。
バッチのコミットが実行されると、バッチのすべてのドキュメント(イメージおよび非イメージ)とそのメタデータが取得され、選択された出力形式で特定の場所またはコンテンツ・リポジトリへと書き込まれ、その後それらがCaptureワークスペースから削除されます。これにより、ドキュメントをコンテンツ・リポジトリ内に配置し、メタデータまたはコンテンツによりアクセスできるようになります。バッチがコミットされたとき、そのドキュメントの一部がコミットされない場合があります。たとえば、必須フィールドに入力されていないドキュメントはスキップされます。バッチのすべてのドキュメントがコミットされた場合、そのバッチはCaptureワークスペースから削除されます。
バッチは、Captureのコミット・プロセッサによって、割当済のコミット・プロファイルで選択されている設定を使用してコミットされます。コミット・プロファイルは、次に対してコミット可能です。
WebCenter Content Server
WebCenter Imaging (直接または入力エージェント経由)
コミット・テキスト・ファイル(多くは、他のプロセスやOracleテクノロジによる消費用)
バッチは、コミットの間に次のいずれかの形式で出力できます。
TIFF複数ページ
PDFイメージのみ
検索可能PDFと、OCR (Optical Character Recognition)によってドキュメントで検出されたテキストを含むオプションの全文テキスト・ファイル。
コミットの間にイメージ形式に変換されなかった非イメージ・ファイルは元の形式のまま残されます。
コミットの詳細は、第8.1項を参照してください。
Captureクライアントは、ナレッジ・ワーカーやスキャン・オペレータが、スキャナまたはファイル・フォルダからインポートされたドキュメント・ファイルを使用してバッチを作成するためのエンド・ユーザー・アプリケーションです。クライアントには次の主要な機能があります。
ドキュメントのスキャンとインポート(業界標準のTWAINインタフェースを使用したデスクトップ・スキャナまたはその他のTWAIN互換入力デバイスからのスキャン)
ドキュメントのレビュー、編集および索引付け
ドキュメントのリリース(結果的にドキュメントの処理、コンテンツ・リポジトリへのチェックイン、またはビジネス・アプリケーション・レコードへの添付が可能)
Captureクライアントには、左上のバッチ・ペインに固定された単一のウィンドウがあり、その他のペインはバッチ・ペインでの選択に基づいて変わります。たとえば、図1-1の右側に表示されたドキュメント・ペインには、ページ・サムネイル(ページの縮小表示)と、編集しているドキュメントのオプションおよびそのページが表示されています。左下の索引付けペインには、選択されたドキュメントについて入力するためのメタデータ・フィールドが表示されます。
Captureクライアント・ユーザーの情報は、『Oracle Fusion Middleware Oracle WebCenter Captureの使用』を参照してください。
キャプチャ・ワークスペースは、特定の環境のメタデータ、構成プロファイルおよび物理データを集中管理する場所を提供する完全なキャプチャ・システムです。キャプチャ・クライアントのユーザーは、権限を付与されているワークスペース内でバッチを作成してアクセスできます。ワークスペース・マネージャは、自分にアクセス権が付与されているワークスペースを構成および管理し、自分のワークスペースに対する他のユーザーのアクセスを制御します。
キャプチャ・ワークスペースには、次の利点があります。
部門や部署または組織ごとにドキュメント・キャプチャを管理するために役立つ、個別の作業領域
複数のキャプチャ・コンポーネントを再利用するための共有可能な要素
ワークスペースでのユーザー/グループの制限により可能になる、ワークスペースへのセキュアなアクセス
ワークスペースのコピー機能により、ワークスペースの構成を別の環境に容易に適用可能
ワークスペース内で作成されたバッチに対するアクセスを、クライアント・プロファイルに従って制限する機能
ワークスペースの詳細は、第3.1項を参照してください。
WebCenter Captureでは、次のプロセッサを提供します。ワークスペース・マネージャはワークスペース・コンソール内でこれらのプロセッサの自動化を構成できます。
インポート・プロセッサは、ファイル・システム・フォルダ、区切り形式のリスト(テキスト/ASCII)のファイルまたは電子メール・サーバーの受信ボックス/フォルダなどのソースからの自動化された一括インポートを提供します。インポート・ジョブはソースを監視し、指定された頻度で(1分、1時間、1日ごとなど)インポートを実行します。第5.1項を参照してください。
ドキュメント変換プロセッサは、Oracle Outside Inテクノロジを使用して、イメージ以外のドキュメントをCaptureで指定された形式に自動的に変換します。ドキュメントは、変換時に様々な方法でマージすることもできます。たとえば、変換プロセッサでは、PDFやMicrosoft Officeドキュメントなどのドキュメント・ファイルをTIFFイメージ形式に変換できます。第6.1項を参照してください。
認識プロセッサは、バー・コード認識、ドキュメント分割(パッチ・コード分割を含む)および自動索引付けを自動的に実行します。第7.1項を参照してください。
コミット・プロセッサは、コミット・プロファイルを実行して、指定された場所またはコンテンツ・リポジトリに自動的にバッチを出力し、その後ワークスペースからバッチを削除します。サポートされる出力形式には、TIFF、イメージのみのPDF/Aおよび検索可能なPDFドキュメントが含まれます。コミット・プロファイルは、ドキュメントとメタデータの出力方法を指定し、メタデータ・フィールド・マッピング、出力形式、エラー処理の指示およびコミット・ドライバの設定を含みます。第8.1項を参照してください。
バッチ・フロー
ワークスペース・マネージャは、後処理オプションによって、バッチを特定のバッチ・プロセッサのキューに配置できます。
構成した場合、インポート処理が最初の処理ステップであり、ドキュメント・バッチの作成とキャプチャを受け持ちます。
構成した場合、コミット処理が最後の処理ステップです。
構成した場合、ドキュメント変換および認識処理は中間的な処理です。バー・コード認識にはイメージ形式が必要ため、通常は、ドキュメント変換が認識よりも前に実行されます。
次に、バッチ・フローの例を示します。
バッチは、クライアントか、インポート・プロセッサ・ジョブでキャプチャされます。
クライアント・プロファイルの後処理またはインポート・ジョブがドキュメント変換に設定されています。
インポートされたバッチは、ドキュメント変換ジョブによりイメージに変換されます。
変換ジョブの後処理は、認識プロセッサに設定されています。
変換されたイメージ・ドキュメントのバー・コードは認識ジョブによって処理されます。
認識ジョブの後処理は、コミット・プロセッサに設定されています。
コミット処理に到達すると、オンライン・コミット・プロファイルがドキュメントを処理し、リポジトリまたはネットワーク・フォルダにコミットします。
Captureでは、ワークスペース・マネージャがCapture全体で使用するワークスペースと要素を作成および管理できる、中央の構成コンソールが提供されます。たとえば、ワークスペース・マネージャはコンソールでメタデータ・フィールド、選択リストおよびデータベース参照を作成し、それらをクライアント・プロファイルやバッチ・プロセッサなどの複数の領域で使用できます。第3.1項を参照してください。
Captureでは、次の管理者およびユーザー・ロールが提供されており、それぞれが異なるアクセス・レベルと一連のタスクを持ちます。
システム管理者は、Captureシステム環境をインストールおよび構成し、ポリシー・ストアで構成されたユーザーまたはグループをCaptureのロールにマップし、さらにCaptureの処理を監視します。さらに、Captureワークスペースで使用するデータ・ソースも管理します。システム管理者には、Enterprise ManagerおよびOracle WebLogic Serverのアクセス権など、システム管理者の権限が与えられていることを想定しています。システム管理の詳細は、『Oracle Fusion Middleware Oracle WebCenter Captureの管理』を参照してください。
キャプチャ・ワークスペース・マネージャは、自分が作成したワークスペースと、アクセス権が与えられたワークスペースへの読取り/書込みアクセス権を持ちます。ワークスペースの追加、編集、コピーおよび削除と、プロファイルおよびプロセッサの構成が可能です。ワークスペース・マネージャは、割り当てられたワークスペースへ特定のWLSTコマンドを使用することも可能です。タスクの情報は、第1.8項を参照してください。
キャプチャ・ワークスペース参照者は、アクセス権が許可されたワークスペースへの読取り専用アクセス権を持ちます。たとえば、ワークスペース参照は、問題を解決するためにワークスペースの構成、クライアント・プロファイルおよびワークスペース内のプロセッサ・ジョブ設定を確認できます。ワークスペース参照は、ワークスペースに変更を加えることはできません。
キャプチャ・ユーザーは、Captureクライアントのみへのアクセス権を持ちます。参照および選択できるクライアント・プロファイルはアクセス権が与えられたもののみです。このエンド・ユーザーは、バッチ、ドキュメントおよびページなど、バッチに関係するコンテンツをワークスペース内に作成します。Captureユーザーの情報は、『Oracle Fusion Middleware Oracle WebCenter Captureの使用』を参照してください。通常、ワークスペース・マネージャには、ワークスペース・マネージャとユーザー・ロールの両方が割り当てられ、これにより、ワークスペースの構成とクライアントでの構成のテストを切り替えて行うことができます。
開発者は、Captureコンポーネントで使用するカスタマイズ・スクリプトを記述し、Captureワークスペース・マネージャとして追加されてワークスペース・マネージャのロールを付与されるか、またはワークスペース・マネージャにスクリプトを提供します。この場合、ワークスペース・マネージャがそのスクリプトをCaptureコンポーネントでインポート、参照およびテストします。Captureのスクリプトの開発は、『Oracle Fusion Middleware Oracle WebCenter Captureのためのスクリプトの開発』を参照してください。
Captureのユーザー・ログイン、アクセスおよび認証は、Oracle Enterprise ManagerおよびOracle Platform Security Services (OPSS)と統合されています。認証後、ユーザーの権限は割り当てられたCaptureのロールによって異なります。ロールは、システム管理者によりOracle Enterprise Managerで割り当てられます。
Captureには、複数のアクセス・ポイントがあり、次の項で説明します。
コンソールおよびワークスペース機能へのアクセス権は次のとおりです。
コンソールの場合、ワークスペース・マネージャおよび参照者にはそれぞれCaptureワークスペース・マネージャまたは参照者ロールが割り当てられ、ワークスペース・コンソールへのサインインおよびアクセスが可能になります。
ワークスペースの場合、ワークスペース・マネージャには自動的に自分の作成したワークスペースへのアクセス権が与えられます。他のワークスペースにアクセスするには、第3.3項の説明のとおり、ワークスペースのアクセス権を持つマネージャが、「セキュリティ」タブで他のマネージャおよび参照者にそのワークスペースへのアクセス権を付与する必要があります。
クライアントおよびクライアント・プロファイル機能へのアクセス権は次のとおりです。
クライアントの場合、Captureユーザー・ロールを割り当てられたCaptureユーザー、ワークスペース参照者およびワークスペース・マネージャはクライアントへのサインインおよびアクセスが可能になります。
クライアント・プロファイルの場合、第4.16項説明のとおり、ワークスペース・マネージャには、クライアント・プロファイルの「セキュリティ」トレイン・ストップで選択されたプロファイルへのユーザー、マネージャまたは参照者のアクセス権を付与する必要があります。
次の手順は、ワークスペース・ペインとワークスペースのタブを使用して、ワークスペース環境を構成および管理する方法をまとめています。
第2章の説明に従って、ワークスペース・コンソールおよびCaptureクライアントへのアクセスを開始します。
ワークスペース・ペインで、ワークスペースを作成および管理します。
ワークスペース・マネージャ・ロールは、自分が作成したワークスペースへのアクセス権と、他のワークスペース・マネージャから付与されたワークスペースへのアクセス権を持ちます。第3.2項を参照してください。
「セキュリティ」タブで、Captureユーザーへのワークスペース・アクセス権を管理します。第3.3項を参照してください。
メタデータおよび「分類」タブで、メタデータ・フィールド、選択リスト、データベース参照、バッチ・ステータスおよびドキュメント・プロファイルなど、ワークスペースで使用するワークスペース要素を作成および管理します。第3章を参照してください。
第4章の説明に従って、「キャプチャ」タブで、クライアント・プロファイルを作成および管理します。Captureクライアントで、クライアント・プロファイルをテストします。
第5章の説明に従って、「キャプチャ」タブで、インポート・プロセッサ・ジョブを作成および管理します。
「コミット」タブで、コミット・プロファイルを作成および管理します。第8.1項を参照してください。
「詳細」タブで、開発者が提供したスクリプトをインポートします。第3.11項を参照してください。
必要に応じて、WLSTコマンドを使用してワークスペースをインポートおよびエクスポートするか、バッチをリリースまたはエクスポートします。第9章を参照してください。
Captureの機能を拡張するために、Java開発者がJavaScript拡張の記述および組込みを行うことができます。たとえば、Captureクライアント拡張は、優先度計算を使用して、トランザクションで使用されているアカウント番号を検証できます。また、名前の最初の文字を大文字にするように強制できます。
Captureの動作は、次のコンポーネントでカスタマイズできます。
Captureクライアント
インポート・プロセッサ
認識プロセッサ
サポートされているCaptureコンポーネントでのスクリプトの使用は、第3.11項を参照してください。スクリプトの記述に関する開発用の情報は、『Oracle Fusion Middleware Oracle WebCenter Captureのためのスクリプトの開発』を参照してください。
Oracle WebCenter Captureを使用すれば、事実上すべてのタイプのドキュメントを処理できます。このガイドでは、Oracle WebCenter Captureが大量の顧客ドキュメントを処理し、ワークスペース・マネージャがビジネス・ニーズに合わせてできるかぎり自動化するユースケースを説明しています。
顧客ワークスペースでは、次の種類の顧客ドキュメントが処理されます。
Correspondence (連絡)
Purchase Orders (発注)
Customer Agreements (顧客契約)
図1-3に、ワークスペースの主要な構成を示します。
3つのドキュメント・プロファイルで主な処理対象のドキュメントの種類、Correspondence、Purchase OrderおよびCustomer Agreementに対応します。
Correspondenceはメールで送付されます。これは、次の手順で行われます。
クライアント・ユーザーが、連絡ドキュメントのバッチをCorrespondenceクライアント・プロファイルを使用してスキャンおよび索引付けし、次にそれらをリリースします。
ドキュメントがテキスト・コミット・プロファイルによってフォルダに出力され(コミットされ)、他のプロセスによって取得されます。
Purchase Ordersは電子メールで送付されます。これは、次の手順で行われます。
インポート・プロセッサ・ジョブによって、指定されたアカウントの新規電子メール・メッセージが確認され、添付の発注ドキュメントとともに、電子メール・メッセージのインポートおよび索引付けが行われます。
ドキュメントは、トランザクション処理について、Content Imagingへとコミットされます。
Customer Agreementsは、様々な複合機能デバイス(MFD)を使用してスキャンされ、スキャン済ドキュメントはネットワーク・ファイル共有へ送信されます。このドキュメントはTIFFまたはPDF形式で送信されます。これは、次の手順で行われます。
インポート・プロセッサ・ジョブによって、ネットワーク・フォルダの新しいファイルが確認され、インポートされます。
ドキュメント変換ジョブによってPDFドキュメントが標準のイメージ形式に変換されます。ドキュメント変換ジョブは、すべての受信ドキュメントをイメージ形式にして、認識プロセッサによる処理を可能にします。
認識ジョブは、イメージのバー・コードを読み取り、イメージをドキュメントに分割して、ドキュメントに索引付けします。ドキュメントの分割は、複数の契約書がスキャンで1つのファイルに出力された場合に必要となります。
ドキュメントは、Content Serverでの格納と取出しのためにコミットされます。
図1-4は、Customerワークスペースに定義されたメタデータ・フィールドを示しており、それらは適用時にドキュメント・プロファイルに組み込まれます。たとえば、Correspondenceドキュメント・プロファイルには、Customer ID、Customer Name、Product Family、Product、およびCorrespondence Typeメタデータ・フィールドが含まれます。
Correspondence Typeメタデータ・フィールドは、ユーザー定義選択リストを使用します。これにより、ユーザーは、索引付けするドキュメントのタイプを選択できます(「不満」、「満足」、「意見」、「その他」のドキュメント)。
Customer Nameメタデータ・フィールドはデータベース参照を使用します。この参照では、顧客名を検索し、完全な顧客名と一意のCustomer IDの両方を返します。
Product FamilyおよびProductメタデータデータ・フィールドでは、ユーザーがデータベース・ソースからの製品情報を選択できるデータベース選択リストが使用されます。これらには選択リストの依存性があり、ユーザーの製品ファミリの選択によって、リスト表示される製品が決定されます。
複数のシナリオで、ドキュメント変換とマージが重要な役割を果たし、Captureの他の自動化バッチ・プロセッサを使用するときは特に重要になります。
たとえば、組織で、電子メールによる経費レポートなどのPDFドキュメントを受信するとします。各PDFドキュメントにはバー・コードが含まれており、電子メール・メッセージには関係する情報を含めることができます。次の構成を作成できます。
インポート・プロセッサ・ジョブは、電子メール・メッセージをインポートして、2つのドキュメントを含むバッチを作成します(PDFと、末尾に置かれる電子メール・メッセージ)。インポート・プロセッサは、電子メール・メッセージの処理後、バッチをドキュメント変換プロセッサに送ります。
ドキュメント変換プロセッサ・ジョブによって、各バッチのPDFと電子メール・メッセージがイメージ形式に変換されます。(イメージ形式は、以降のバー・コード認識で必要となります。)このプロセッサは2つのドキュメントを1つのドキュメントにマージし、電子メールの情報を必要に応じて利用できるようにします。電子メールに2つのPDF経費レポートが含まれている場合、電子メール・メッセージは各経費レポートの最後のページに表示される必要があります。ドキュメント変換プロセッサが認識プロセッサにバッチを送ります。
認識プロセッサ・ジョブはバー・コード認識と各ドキュメントの索引付けを実行します。認識プロセッサがコミット・プロセッサにバッチを送ります。
コミット・プロセッサがバッチをコミットします。