ヘッダーをスキップ
Oracle® Fusion Middleware Oracle WebCenter Captureのマネージング
11g リリース1 (11.1.1)
E51450-01
  ドキュメント・ライブラリへ移動
ライブラリ
目次へ移動
目次

前
 
次
 

6 ドキュメント変換処理の管理

Captureのドキュメント変換プロセッサには2つの主要な機能があります。それらは、イメージ以外のドキュメントをイメージ形式に自動的に変換するOracle Outside Inテクノロジを使用することと、オプションでドキュメントをマージすることです。この章では、ワークスペース・マネージャが、ドキュメント変換ジョブを構成し、それらの処理を監視することで、ドキュメント変換を管理する方法について説明します。

この章では、次の項目について説明します。

6.1 ドキュメント変換の概要

この項の内容は次のとおりです。

6.1.1 主要なドキュメント変換ジョブの設定

ドキュメント変換プロセッサでは、Microsoft Word、ExcelまたはPDFドキュメントなどの非イメージ電子ドキュメントをイメージ形式に自動的に変換できます。次の情報を指定するドキュメント変換プロセッサ・ジョブを作成します。

  • どのファイルを変換するか(ファイル名の指定による。例、PDFファイル)。

  • 非イメージ・ファイルを変換する形式(白黒のTIFFまたはカラーのJPEG)。

  • ドキュメント変換時に非イメージ・ドキュメントをマージするかどうか、およびその方法。さらにマージの際にメタデータ値を適用する方法。

  • ドキュメント変換後の次の後処理ステップ(存在する場合)。たとえば、変換後のバッチは認識プロセッサ・ジョブで処理される場合があり、またコミット・プロセッサが出力する可能があります。後処理のステップを指定しない場合、処理済のバッチは、索引付けするユーザーが入力するために利用可能となります。

図6-1 「ドキュメントの選択」トレイン・ストップでのドキュメントの変換の指定

図6-1の説明が続きます
「図6-1 「ドキュメントの選択」トレイン・ストップでのドキュメントの変換の指定」の説明

6.1.2 ドキュメント変換の重要点

  • バッチに実行されるドキュメント変換では、イメージと非イメージ・ドキュメント・ファイルを混在して含めることができます。プロセッサが、イメージ形式のドキュメントを検知すると、イメージのバッチ・アイテムの変換をスキップしながら構成どおりにドキュメントをマージするようにバッチが処理されます。

  • Captureでは、ドキュメント変換はバッチの中間的なフロー・ステップです。これは、バッチがどのようにドキュメント変換(第6.7項)および次のドキュメント変換の後に発生する後処理ステップ(存在する場合)(第6.6項)に至るかを構成する必要があることを意味します。

  • ドキュメント変換処理は後処理オプションによって監視できます。たとえば、電子メール通知を正常に処理されたバッチと、システム・エラーが発生したバッチに対して別々に構成したり、バッチの名前を変更したり、ステータスや優先度を変えたりすることができます。後処理の情報は、第6.6項を参照してください。システム・エラーの詳細は、第6.8項を参照してください。

6.1.3 ドキュメント変換プロセッサを他のバッチ・プロセッサとともに使用

ドキュメント変換プロセッサは、次のようなシナリオで他のプロセッサ・ジョブとともに使用されることがよくあります。

6.1.3.1 ユースケース1: 経費レポートの処理

  1. エンド・ユーザーが複合機能デバイス (MFD)を使用して経費レポートをスキャンし、このレポートが電子メールで送信されます。

    1. エンド・ユーザーは、受領書とともに経費レポートを1つのPDFファイルとしてスキャンします。これには、表示と1つ以上のバー・コードが含まれています。

    2. エンド・ユーザーは次にそのPDFを電子メールに添付して、指定された電子メール・アカウントに送信します。

  2. インポート・プロセッサは、電子メールをインポートおよび処理し、バッチを作成し、ドキュメント変換へと渡します。

    1. インポート・プロセッサは、電子メール・メッセージを処理して、次の2つのドキュメントを含むバッチを作成します。

      1) レポートPDF (表示/レポート)

      2) バッチの最後のドキュメントとして位置指定された電子メール・メッセージ

    2. インポート・プロセッサは、電子メール・メッセージの処理後、バッチをドキュメント変換プロセッサのキューに送ります。

  3. ドキュメント変換プロセッサは、バッチ内のドキュメントをイメージ形式に変換し、それらのドキュメント(経費レポートと電子メール・メッセージ)を1つのドキュメントにマージして、そのバッチを認識処理に送ります。

    1. ドキュメント変換プロセッサは、PDFと電子メール・メッセージをイメージ形式に変換して、認識プロセッサがそれらに対してバー・コード認識を実行できるようにします。

    2. ドキュメント変換プロセッサは2つのドキュメントをイメージ形式に変換します。電子メールに重要情報がある場合、経費ドキュメントの最後のページとして含められます。

    3. ドキュメント変換プロセッサが認識プロセッサ・キューにバッチを送ります。

  4. 認識プロセッサはバー・コード認識とドキュメントの索引付けを実行し、そのバッチをコミットに送ります。

  5. コミット・プロセッサがバッチをコミットします。

6.1.3.2 ユースケース2: 請求書の処理

  1. ベンダーが、指定された電子メール・アカウントに電子メールを送付します。その電子メールには2つの請求書がPDF形式で添付され、電子メール・メッセージの本文テキストに説明文が記述されます。

  2. インポート・プロセッサは、電子メール・メッセージをインポートおよび処理して、3つのドキュメントを含むバッチを作成します。

    インポート・ジョブは、バッチ内の最後のドキュメントとして電子メール・メッセージの本文を配置し、そのバッチをドキュメント変換に送るように構成されています。

  3. ドキュメント変換プロセッサはバッチを変換およびマージし、コミットへと転送します。

    1. ドキュメント変換ジョブによってPDFと電子メール・メッセージ・ドキュメントがイメージ形式に変換されます。

    2. インポート・ジョブは、バッチ内の最後のドキュメントとして電子メール・メッセージの本文を配置し、そのバッチをドキュメント変換に送るように構成されています。その結果、電子メール・メッセージの本文が両方の請求書に付加されます。

    3. 電子メール・メッセージのドキュメント(3番目のドキュメント)がバッチから削除されます。

  4. コミット・プロセッサは、Oracle WebCenter Forms Recognitionなどの他のプロセスが自動的なデータ抽出を実行できるように、元の電子メール・メッセージとともにそれぞれの請求書をコミットします。

6.2 ドキュメント変換ジョブの追加、コピーまたは編集

ドキュメント変換ジョブを追加、コピーまたは編集する手順は次のとおりです。

  1. 選択したワークスペースで、「処理」タブを選択します。

  2. 「ドキュメント変換ジョブ」表で、追加ボタンをクリックするか、ジョブを選択して編集ボタンをクリックします。

    ドキュメント変換ジョブは、ジョブを選択して、コピー・ボタンをクリックし、新しい名前の要求時に入力することで、コピーすることもできます。ジョブのコピーにより、すばやく複製し変更できます。

  3. 「ドキュメントの選択」トレイン・ストップで、タブで、設定を入力します。

    1. 「名前」フィールドに、ジョブの名前を入力します。

    2. 「変換するドキュメント」フィールドで、すべての非イメージ・ドキュメントを処理するか、指定されたフィルタのもののみを処理するかを選択します。たとえば、PDFドキュメントのみを処理するには、「イメージ以外の選択されたドキュメント」を選択し、次に「ファイル名フィルタ」フィールドに*.pdfと入力します。ワイルドカード文字としてアスタリスク(*)を入力でき、複数のフィルタはカンマまたはセミコロンで区切ることができます。

  4. 「出力形式」トレイン・ストップで設定を入力します。

    非イメージ・ドキュメントは、白黒のTIFF (デフォルト)またはカラーのJPEGに変換できます。JPEGを選択した場合は、圧縮を使用するためにイメージ品質を「JPEGイメージの品質」フィールドで0 (最低品質)から100 (最高品質)の間で選択します。デフォルト値は85です。「DPI」フィールドで解像度を選択します。デフォルトは200です。

  5. 「ドキュメント・マージ・オプション」トレイン・ストップで、タブで、設定を入力します。

    第6.5項を参照してください。

  6. 「後処理」トレイン・ストップで、ドキュメント変換処理の完了後、成功かどうかに応じてどのような処理を行うかを指定します。

    第6.6項を参照してください。

  7. 「サマリー」トレイン・ストップの設定を確認して、「送信」をクリックし、ジョブを保存します。

  8. バッチのプロセッサ・ジョブへのフローを構成します。第6.7項を参照してください。

  9. 作成したドキュメント変換ジョブをテストします。

6.3 ドキュメント変換ジョブの削除

ドキュメント変換ジョブを削除すると、変換ジョブが後処理ステップとして設定されているユーザーのバッチでその変換ジョブは使用できなくなります。後処理に指定されたジョブが使用できない場合は、バッチでエラーが発生します。ジョブを削除する前にしばらくの間オフラインに変更して、その削除に伴う予期しない問題を解決できるようにしておくのが望ましい場合もあります。

ドキュメント変換ジョブを削除する手順は次のとおりです。

  1. 選択したワークスペースで、「処理」タブを選択します。

  2. 「ドキュメント変換ジョブ」表で削除するジョブを選択して、「削除」ボタンをクリックします。

    これを行わずジョブを非アクティブにするには、選択して「オンライン/オフラインの切替え」ボタンをクリックします。

  3. プロンプトが表示されたら、「はい」をクリックして、削除を確定します。

6.4 ドキュメント変換ジョブのアクティブ化と非アクティブ化

オンラインの場合は、ドキュメント変換ジョブをクライアント・プロファイルまたはプロセッサ・ジョブの「後処理」で選択すると、ドキュメント変換ジョブが実行されます。ジョブは一時的に実行を停止(オフライン)したり、非アクティブのジョブを再度実行することができます。


注意:

ジョブを再度アクティブ化するとき、そのジョブのオフライン時にキューに入っていたバッチの処理を再開するには、最大1分程度の時間がかかる場合があります。


次の手順を実行して、ドキュメント変換ジョブをオンラインまたはオフラインに変更します。

  1. 「処理」タブの「ドキュメント変換ジョブ」表でジョブを選択します。「ステータス」列で、ジョブごとに「オンライン」または「オフライン」と表示されていることを確認してください。

  2. 「オンライン/オフラインの切替え」ボタンをクリックしてプジョブをアクティブ化するか、非アクティブ化します。

    ドキュメント変換ジョブは、「ドキュメントの選択」トレイン・ストップの「オンライン」フィールドを選択または非選択にすることでも、アクティブ化または非アクティブ化できます。

6.5 ドキュメントのマージとメタデータの割当て方法の指定

ドキュメント変換プロセッサによって、変換処理時にバッチのドキュメントをマージするかどうかと、マージ方法、およびドキュメントをマージするときにメタデータ値を割り当てる方法を指定できます。

マージとメタデータ割当てオプションは、一般的なドキュメント変換シナリオに対応しています。たとえば、インポート・プロセッサは電子メール・メッセージとPDFの添付ファイルをインポートしてから、ドキュメント変換に送ることができます。添付のPDFのそれぞれに電子メール・メッセージは共通であり、さらにそれぞれの処理や索引付けに重要な可能性があるため、ソース・ドキュメント(この場合は電子メール・メッセージ)とその他のすべてのターゲット・ドキュメント(PDF)をマージするドキュメント・マージ・オプションの1つを選択します。

  1. 第6.2項の説明に従って、ドキュメント変換ジョブを追加または編集し、「ドキュメント・マージ・オプション」トレイン・ストップを選択します。このタブを使用して、次の項目を指定します。

    • バッチ内のドキュメントをマージするかどうかと、マージする方法

    • 1つのドキュメントを他のすべてのドキュメントとマージする場合、そのドキュメントを配置する位置

    • マージするときに、どのドキュメントのメタデータ値を割り当てて保存するか

  2. バッチ・マージ・オプションを選択します。次の選択が可能です。

    • ドキュメントをマージしない: 変換するバッチがすでにドキュメントに組み込まれている場合や、ドキュメントをマージせずに変換する場合は、このオプション(デフォルト)を選択します。このオプションを選択すると、タブ上の他のすべてのフィールドが無効になります。

    • すべてのドキュメントをマージ: バッチ内のすべてのドキュメントを単一のドキュメントにマージする場合は、このオプションを選択します。選択時には、バッチの最初のドキュメントはターゲット・ドキュメントと見なされ、他のすべてのドキュメントはソース・ドキュメントと見なされて、付加されます。

    • 最初のドキュメントをその他のすべてのドキュメントとマージ: バッチ内の最初のドキュメントを他のすべてのドキュメントとマージする場合は、このオプションを選択します。最初のドキュメントはソース・ドキュメントと見なされ、「ソース・ドキュメント・ページの配置」の設定に基づいてターゲット・ドキュメントの先頭または末尾に追加されます。

    • 最後のドキュメントをその他のすべてのドキュメントとマージ: バッチ内の最後のドキュメントを他のすべてのドキュメントとマージする場合は、このオプションを選択します。最後のドキュメントがソース・ドキュメントと見なされ、「ソース・ドキュメント・ページの配置」の設定に基づいてターゲット・ドキュメントの先頭または末尾に追加されます。

  3. 「ソース・ドキュメント・ページの配置」で、ソース・ドキュメントをターゲット・ドキュメントの先頭または末尾に追加するかどうかを指定します。

    このフィールドは、「最初のドキュメントをその他のすべてのドキュメントとマージ」または「最後のドキュメントをその他のすべてのドキュメントとマージ」オプションが「バッチ・マージ・オプション」フィールドで選択されている場合のみ適用されます。

  4. マージされたドキュメントにメタデータ値を適用する方法を指定します。次の選択が可能です。

    • ソース・ドキュメントのメタデータ値の適用: ソース・ドキュメントのメタデータ値をターゲット・ドキュメントに適用する場合は、このオプションを選択します。各ソース・ドキュメントにメタデータ値がある場合は、最後に処理されたメタデータ値がターゲット・メタデータ値になります。

    • ターゲット・ドキュメントのメタデータ値の上書き許可: ターゲット・ドキュメントのメタデータ値をソース・ドキュメントで上書きすることを許可する場合は、このオプションを選択します。

    これらのフィールドは、同時に選択できます。これらはデフォルトで選択されています。先頭または最後のドキュメントをマージするときのデフォルトの動作では、ターゲット・ドキュメントのメタデータ値が適用されます。すべてのドキュメントをマージするときのデフォルトの動作では、最初のドキュメント(ターゲット)のメタデータ値が適用されます。

6.6 後処理と監視の構成

ドキュメント変換ジョブの後処理オプションは、処理の完了後、処理が成功したかどうかに応じてどのような処理を行うかを指定するために使用します。

後処理設定を構成する手順は次のとおりです。

  1. 選択したワークスペースで、ドキュメント変換プロセッサ・ジョブを追加または編集します。第6.2項を参照してください。

  2. 「後処理」トレイン・ストップをクリックします。

    画面には、処理の成功(システム・エラーなし)と処理の失敗(1つ以上のシステム・エラー)に対して同じ処理オプションが表示されます。

  3. 「バッチ・プロセッサ」および「バッチ・プロセッサ・ジョブ」フィールドで、ドキュメント変換処理の完了後に発生させる処理がある場合は、どの処理ステップを発生させるかを指定します。バッチ・プロセッサには、「なし」(処理は発生しません)、「コミット・プロセッサ」、「認識プロセッサ」または「ドキュメント変換プロセッサ」を選択できます。認識プロセッサまたはドキュメント変換プロセッサを選択した場合は、プロセッサ・ジョブを指定します。

    たとえば、システム・エラーがないバッチをコミット・プロセッサに送信できます。システム・エラーがあるバッチに「なし」を指定し、バッチ・ステータスまたは接頭辞を変更してクライアントでのその後の処理に利用できます。

  4. 電子メール・アドレス・フィールドで、処理が正常に完了した場合や失敗した場合に電子メールを送信するアドレスをオプションで入力します。ドキュメント変換プロセッサ・ジョブを構成およびテストするとき、システム・エラーの発生時に電子メール通知を自分自身で受信し、後から自動的に管理者へ処理エラーを通知するように設定できます。

  5. 残りのフィールドで、処理済のバッチを変更する方法について指定します。

    1. 接頭辞を追加して、バッチの名前を変更します。たとえば、失敗したバッチへ、追跡用にERRの接頭辞を付けて名前を変更します。

    2. バッチ・ステータスまたは優先度を変更します。たとえば、システム・エラーのバッチのステータスを変更し、バッチ・フィルタリングをこのステータスに設定したクライアント・プロファイルを作成して、資格のあるユーザーがエラーの発生したバッチを手動で編集および完成できるようにできます。

  6. ジョブを保存するには、「送信」をクリックします。

6.7 ドキュメント変換プロセッサ・ジョブへのバッチ・フローの構成

ドキュメント変換ジョブを実行するには、バッチが処理用のジョブへ渡されるようにフローを構成します。これは、クライアント・プロファイルまたは他の処理ジョブにドキュメント変換プロセッサ・ジョブを後処理ステップとして設定することで実現できます。バッチ・フローを構成する手順は次のとおりです。

たとえば、電子メール・メッセージとPDFの添付ファイルをインポートするインポート・プロセッサ・ジョブを作成して、イメージ形式への変換のためにドキュメント変換プロセッサに送り、次にバー・コード認識のために認識処理ジョブに送ることができます。

6.8 ドキュメント変換処理のシステム・エラーの処理

ドキュメント変換プロセッサ・ジョブでは、処理中に次のようなシステム・エラーが発生する場合があります。

電子メールの通知に加えて、Captureのシステム管理者は、システムの問題に対応するために、ドキュメント変換プロセッサのパフォーマンス・メトリクスとログを参照できます。