認識プロセッサ・ジョブの構成

認識プロセッサを使用すると、プロシージャでイメージ・ドキュメントのバー・コードの認識、ドキュメントの分割および索引付けを自動化できます。

認識処理について、また認識ジョブの構成方法および管理方法について学習するには、次を参照してください:

認識処理について

認識プロセッサは、様々なドキュメントのシナリオと構成に対応するように設計されています。一般的な認識処理のシナリオは次のとおりです:

  1. 認識ジョブは、クライアント・ユーザーがドキュメントを含んだ大規模なバッチをスキャンしてリリースした後の後処理として実行されます。

  2. 認識ジョブは、バッチ内の各ページのバー・コードやパッチ・コードを検出します。

  3. 選択されたジョブのドキュメント編成方法に基づいて、認識プロセッサはバッチのページを個々のドキュメントに分割します。

  4. 認識ジョブは、バー・コード値、デフォルト値、または値をドキュメント・メタデータ・フィールドに適用することにより、ドキュメントに索引を付けます。

  5. 認識処理後の後処理ステップとして、バッチはコミット・プロセッサにリリースされます。

認識プロセスの基礎となる主な概念は次のとおりです:

ドキュメント編成方法

ドキュメントを編成するために認識プロセッサが必要とするのは、バッチに単一のイメージ形式のドキュメントが含まれていることです(その単一ドキュメントが実際には複数のドキュメントで構成されている場合もあります)。バッチの処理時、認識プロセッサは、選択されたドキュメント編成方法に従ってバッチを論理ドキュメントに編成します。たとえば、各ドキュメントに固定数のページが含まれるように指定したり、ドキュメントの間にセパレータ・ページが含まれるように指定したりできます。

ドキュメントがすでに分割されており、バー・コード認識のみが必要なバッチの場合、ドキュメントの編成をスキップするように認識ジョブを構成できます。認識ジョブの「ドキュメント編成」ページでドキュメントの編成方法を指定します。次のいずれかの方法を選択できます:

その他のキー認識プロセッサ・ジョブ設定

ドキュメント編成方法の他に、次の主要な相互関連認識ジョブ設定を使用すると、認識プロセッサで自動的にバー・コード認識、ドキュメント区切りおよび索引を実行できます:

バー・コードとパッチ・コードを検出および識別するための設定

認識ジョブを作成するときに、認識プロセッサがバー・コードを検出および識別する方法を指定できます:

  • 「バー・コード認識」ページでは、デフォルトで「ユニバーサル・デコーダ」が選択されています。検出するバー・コード、バー・コードに固有の他の設定、およびパッチ・コード検出を指定します。認識プロセッサはすべてのページを検索して、ジョブで検出するように設定されたバー・コードを認識します。このページでは、次のオプションを使用できます:

    表12-1 ユニバーサル・デコーダのオプション

    オプション 説明

    1次元コード

    認識プロセッサで検索する1次元バー・コード・シンボルのリストから選択します。

    選択できる1次元コードは次のとおりです:

    • Code 128

    • Code 39

    2次元コード

    認識プロセッサで検索する2次元バー・コード・シンボルを選択します。

    選択できる2次元コードは次のとおりです:

    • PDF417

    • QRコード

    イメージ当たりのバー・コードの最大数

    イメージ当たりのバー・コードの最大数を0から10までの範囲で指定します。この設定で指定された値が検出された場合、または値を超えた場合、デコーダはイメージの処理を停止します。この設定は、システムのパフォーマンスを最適化するのに役立ちます。

    デフォルトでは、このオプションは1に設定されています。

    バー・コードの最小の高さ

    イメージに存在できるバー・コードの最小の高さを0.2から3までの範囲で指定します。

    デフォルトでは、このオプションは0.5インチに設定されています。

    この設定は、1次元バー・コードにのみ適用されます。

    この設定は、斜め方向のバー・コードを認識するのに役立ちます。

    メジャーの単位

    「バー・コードの最小高さ」の設定と「バー・コード最大幅」の設定の単位をドロップダウン・リストから選択します。使用可能なオプションは、「インチ」および「cm」です。小数精度は3です。

    バー・コードの最大の幅

    イメージに存在できるバー・コードの最大の幅を、「バー・コードの最小高さ」から10までの範囲で指定します。

    デフォルトでは、このオプションは2インチに設定されています。

    この設定は、1次元バー・コードにのみ適用されます。

    この設定は、斜め方向のバー・コードを認識するのに役立ちます。

    バー・コードの最小文字数

    処理時に考慮されるバー・コードの最小文字数を1から1000までの範囲で指定します。

    デフォルトでは、このオプションは1に設定されています。

    パッチ・コードとしてのバー・コードの解釈

    この設定を使用して、バー・コード値をパッチ・コード・タイプにマップします。

    指定されたバー・コード値が認識されると、バー・コード値としてではなくパッチ・コード・タイプとして解釈するように指定できます。

    「パッチ・コード」の下にリストされる各パッチ・コード・タイプに隣接している「バー・コード値」テキスト・フィールドに英数字のバー・コード値を指定します。

    • I

    • II

    • III

    • IV

    • VI

    • T

    ページ内の最初の一致のみパッチ・コードに変換されます。それ以外のバー・コードは、値がマッピングで指定された値と一致していても、パッチ・コードに変換されません。

    バー・コード値の比較では大/小文字が区別されます。

    注:

    使い慣れている場合は、バー・コード・シンボルを選択することをお薦めします。シンボルを使用すると、パフォーマンスが向上し、処理を妨げる可能性のある不明なバー・コードが検出されるリスクが減ります。

  • 「バー・コード定義」ページで、長さ(文字数)などの特性によってバー・コードを識別する1つ以上のバー・コード定義を指定します。バー・コード定義を作成する場合、次の検証ルールから選択できます:

    • 長さ

    • マスク

    • 正規表現

    • 選択リスト (ページ上のバー・コードが、選択した選択リストに含まれる値と一致する必要があります)

    • なし

    認識プロセッサにより認識されたバー・コードが検証条件を満たした場合、それらはバー・コード定義に割り当てられます。メタデータの割当て時やページの分割時など、ジョブでこれらのバー・コード定義を様々な方法で使用します。バー・コード定義の管理の詳細は、バー・コード定義の追加または編集を参照してください。

ドキュメントを区切るための設定

ドキュメントの区切り(バー・コードやパッチ・コードのセパレータを含む)を定義するための様々なオプションが使用可能です。

「ドキュメント処理」ページで指定するドキュメント区切りオプションは、選択したドキュメント編成オプションによって異なります(ドキュメント編成方法を参照)。

  • ドキュメントに一定数のページを含むことを指定する場合は、ドキュメント当たりのページ数も指定する必要があります。ジョブでこの数に達すると、新規のドキュメントが識別され、バッチ内の次のドキュメントのカウントが再開されます。セパレータは必要ありません。

  • ドキュメントの各ページに同じバー・コード値を含むことを指定する場合は、区切りに使用するバー・コード定義を指定する必要があります。異なるバー・コード値を含むバー・コード定義がジョブで見つかると、新規のドキュメントが作成されます。セパレータは必要ありません。

  • セパレータ・ページに基づいてドキュメントを編成することを指定する場合は、単独セパレータまたは階層セパレータのいずれであっても、バー・コードやパッチ・コードのセパレータ・ルールを指定する必要があります。

  • ドキュメント編成を実行しないことを指定した場合、前のドキュメント区切りが保持されます。特定の非定型的な構成においては、オプションでセパレータを使用できます。

添付を処理するための設定

「ドキュメント処理」ページで使用可能なオプションを使用して、作成したドキュメントにソース・ドキュメントの添付を含めるかどうか、および含める方法を指定できます。「ソース・ドキュメントの添付」フィールドで使用可能な次のオプションから選択できます:

  • 作成したドキュメントにソース・ドキュメントのすべての添付を含める場合は、「すべての添付を作成されたドキュメントに含める」(デフォルト)オプションを選択します。

  • ドキュメント・プロファイルで指定された添付タイプと一致するソース・ドキュメントのすべての添付を含める場合は、「一致するドキュメント・プロファイル添付タイプの添付を含める」オプションを選択します。

  • 作成したドキュメントにソース・ドキュメントの添付を含めない場合は、「添付を含めない」オプションを選択します。

注:

「ドキュメント編成」ページで「なし: ドキュメント編成を実行しない」オプションを選択している場合、「ドキュメント処理」ページで「ソース・ドキュメントの添付」フィールドは使用できません。

ドキュメントを分類するための設定

ドキュメントを処理するとき、認識プロセッサは、ドキュメントの索引付けに使用可能なメタデータ・フィールドを識別するために使用するドキュメント・プロファイルを決定します。「ドキュメント・プロファイル」ページで、認識ジョブでドキュメントの処理時にドキュメント・プロファイルをドキュメントに割り当てる方法を指定します。静的なドキュメント・プロファイルまたは動的に決定されるドキュメント・プロファイルの指定を参照してください。選択したドキュメント編成方法によって、ドキュメント・プロファイルの割当てオプションが影響を受けます。次のようなドキュメント・プロファイル割当てを選択できます:

  • 静的: 「デフォルトのドキュメント・プロファイル」フィールドに入力します。

    「動的に決定しない」フィールドが選択されている場合、または動的に決定される一致するドキュメント・プロファイルが見つからなかった場合は、認識ジョブでデフォルトのドキュメント・プロファイルが使用されます。

  • 動的に決定: ドキュメント編成に応じて、バー・コードまたはセパレータ・ページ値に基づいて決定されます。

メタデータ値を割り当てるための設定

「フィールド」ページでメタデータ値を割り当てるように認識ジョブを構成したり、バー・コード値、バッチ名、デフォルト値、スキャン日付、または索引日付のいずれかの値を自動移入するようプロシージャのメタデータ・フィールドを構成できます。

認識処理後の後処理設定

「後処理」ページで使用可能な設定を適用して、認識処理の完了後に実行する処理を指定できます:

  • システム・エラーが発生していない場合、次のバッチ・プロセッサを指定し、該当する場合は、実行するジョブも指定します。たとえば、次のステップとしてコミット・プロセッサを設定します。また、後処理アクションに「なし」を指定することもできます。(「なし」を選択した場合は、クライアントがバッチを処理する必要があります。たとえば、クライアントがバッチの正確性をレビューし、そのバッチをコミット・プロセッサにリリースする場合などです。)また、認識処理が正常に完了した後に、電子メール通知を送信し、バッチ名、ステータスおよび優先度を変更することもできます。

  • 1つ以上のシステム・エラーが発生した場合、次のバッチ・プロセッサを指定し、該当する場合は、実行するジョブも指定します。「なし」を選択すると、バッチが索引付けのためにクライアント・ユーザーにリリースされます。また、認識処理のシステム・エラーが発生したときに、電子メール通知を送信し、バッチ名、ステータスおよび優先度を変更して適切な担当者に通知することもできます。

一般的な認識プロセッサ・ジョブ設定の構成

これらは、認識プロセッサ・ジョブの使用時に実行する一般的なタスクです。(特定のタイプの認識ジョブの構成の詳細は、ドキュメント編成に基づいたジョブの構成を参照してください。)

認識ジョブの追加または編集

認識ジョブを追加または編集するには:
  1. 左側のプロシージャ・ペインで、プロシージャを選択します。

    選択したプロシージャの構成ページが右側に表示されます。

  2. 「処理」タブを開きます。

  3. 「認識プロセッサ・ジョブ」表で、認識ジョブの追加をクリックして、ジョブを作成します。ジョブを編集するには、それを選択して認識ジョブの編集をクリックします。

    また、認識ジョブをコピーするには、それを選択して認識ジョブのコピーをクリックし、プロンプトが表示されたら新規の名前を入力します。ジョブをコピーすると、すばやく複製および変更できます。

  4. 「一般設定」ページで、ジョブの名前を入力します。

  5. 「バー・コード認識」ページで、バー・コード認識に固有の設定を指定し、認識ジョブで検出するバー・コード・タイプ(シンボル)を識別します。

    バー・コード・シンボルを使用すると、パフォーマンスが向上し、処理を妨げる可能性のある不明なバー・コードが検出されるリスクが減ります。

  6. 「バー・コード定義」ページで、バー・コード定義を追加します。

    バックグラウンド情報については、バー・コードとパッチ・コードを検出および識別するための設定を参照してください。ステップについては、バー・コード定義の追加または編集を参照してください。

  7. 「ドキュメント編成」ページで、バッチ内のドキュメントの構成方法を指定します。

    ドキュメント編成方法を参照してください。

  8. 「ドキュメント・プロファイル」ページで、ドキュメント・プロファイルを指定するか、ドキュメント・プロファイルが動的に決定されるように構成します。表示される設定は、選択したドキュメント編成方法に基づいています。デフォルトのドキュメント・プロファイルを選択する必要があります。

    バックグラウンド情報については、ドキュメントを分類するための設定を参照してください。ステップについては、静的なドキュメント・プロファイルまたは動的に決定されるドキュメント・プロファイルの指定を参照してください。

  9. 「ドキュメント処理」ページで、ドキュメントの区切りおよび処理の方法を指定します。使用可能な設定は、選択したドキュメント編成方法に基づいています。ドキュメントを単独セパレータまたは階層セパレータで区切る場合は、バー・コードまたはパッチ・コードのセパレータ・ルールを構成します。

    バックグラウンド情報については、ドキュメントを区切るための設定を参照してください。ステップについては、セパレータ・ページ定義の構成を参照してください。

    このページでは、「ドキュメント編成」ページでドキュメント編成方法を選択した場合に添付を含めるかどうかも指定できます。添付を処理するための設定を参照してください。

  10. 「フィールド」ページで、ドキュメントごとに、メタデータ・フィールドに自動入力されるようにバー・コードまたは他の値を設定します。

  11. 「後処理」ページで、認識処理の完了後に実行する処理を指定します。

    TIFFへの変換ジョブの後処理および監視の構成を参照してください。

  12. 「サマリー」ページの設定を確認し、「送信」をクリックします。

  13. バッチが認識プロセッサ・ジョブへ送られる方法を構成します.

  14. 認識プロセッサ・ジョブをテストします。

認識ジョブの非アクティブ化または削除

認識ジョブを削除すると、このジョブが後処理ステップとして設定されているバッチにこのジョブは使用できなくなります。認識ジョブを削除する前に、オフラインにして予期しない問題を解決することをお薦めします。オンラインの認識ジョブは、クライアント・プロファイルまたはプロセッサ・ジョブの「後処理」ページで選択されている場合に実行されます。ジョブの実行を一時的に停止(オフラインにする)したり、非アクティブ化されたジョブを変更して再度実行できます。

認識ジョブを非アクティブ化または削除するには:
  1. 左側のプロシージャ・ペインで、プロシージャを選択します。
    選択したプロシージャの構成ページが右側に表示されます。
  2. 「処理」タブを開きます。
  3. 「認識プロセッサ・ジョブ」表で、まず非アクティブ化するジョブを選択し、認識ジョブを非アクティブ化またはアクティブ化をクリックします。

    認識ジョブを非アクティブにしたり、アクティブにするには、「一般設定」ページで「オンライン」フィールドを選択したり、選択解除して、ジョブを非アクティブにしたり、アクティブにすることもできます。

  4. 「認識プロセッサ・ジョブ」表で、非アクティブ化したジョブを選択し、認識ジョブを削除をクリックします。
  5. プロンプトが表示されたら、「はい」をクリックしてこの認識ジョブを削除することを確認します。

認識プロセッサ・ジョブの後処理および監視の構成

認識ジョブの後処理オプションを使用すると、処理の完了後に実行する処理を指定できます。このプロシージャ内に構成する設定は、成功したバッチと失敗したバッチとで別々に指定します。

後処理設定を構成するには:

  1. 認識プロセッサ・ジョブを追加または編集します
  2. 「後処理」ページをクリックして、成功した処理(システム・エラーなし)および失敗した処理(1つ以上のシステム・エラー)に対する処理オプションを表示します。
  3. 「バッチ・プロセッサ」フィールドと「バッチ・プロセッサ・ジョブ」フィールドで、認識処理の完了後に実行する処理ステップ(ある場合)を指定します。「なし」コミット・プロセッサ、認識プロセッサTIFFへの変換PDFへの変換アセット・ルックアップ・プロセッサまたはXML変換プロセッサから選択できます。認識プロセッサまたはTIFFに変換/PDFに変換を選択した場合は、プロセッサ・ジョブを指定します。

    たとえば、システム・エラーのないバッチをコミット・プロセッサに送信します。システム・エラーのあるバッチに対して「なし」を指定してから、クライアントで追加の処理ができるように、そのバッチ・ステータスまたは接頭辞を変更することができます。

  4. 電子メール・アドレスのフィールドに、オプションで、処理が正常に完了または失敗した後に電子メールを送信する宛先のアドレスを入力します。認識プロセッサ・ジョブを構成およびテストしている間は、システム・エラーの発生時に自分に電子メール通知が送信されるように設定してください。また、その後で管理者に処理エラーが自動的に通知されるようにしてください。
  5. 残りの各フィールドで、処理済のバッチを変更する方法を指定します。
    • 接頭辞を追加することにより、バッチの名前を変更します。たとえば、失敗したバッチは、フォローアップのために接頭辞ERRを付けた名前に変更します。

    • バッチ・ステータスまたは優先度を変更します。たとえば、システム・エラーのあるバッチのステータスを変更してから、バッチ・フィルタリングをこのステータスに設定したクライアント・プロファイルを作成すると、適格なユーザーが、エラーの発生したバッチを手動で編集して完了できるようになります。

  6. 「送信」をクリックして、ジョブを保存します。

認識プロセッサ・ジョブへのバッチ・フローの構成

認識ジョブを実行するには、処理のためにジョブに送られるようにバッチを構成する必要があります。これを行うには、クライアント・プロファイルまたは他のプロセッサ・ジョブ内で認識プロセッサ・ジョブを後処理ステップとして指定します。

たとえば、ドキュメントをバッチにスキャンしてから認識処理用にリリースするためのクライアント・プロファイルを作成します。また、まず電子メール・メッセージとそのPDF添付をインポートしてから、それをイメージ形式に変換するために変換プロセッサに送信し、最終的に認識処理のためにドキュメントを送信するインポート・プロセッサ・ジョブを作成することもできます。

ドキュメント編成のスキップを計画していないかぎり、認識プロセッサではバッチに単一のイメージ形式ドキュメントが含まれていることが期待されます(ドキュメント編成方法を参照)。