認識プロセッサを使用すると、プロシージャでイメージ・ドキュメントのバー・コードの認識、ドキュメントの分割および索引付けを自動化できます。
認識処理について、また認識ジョブの構成方法および管理方法について学習するには、次を参照してください:
認識プロセッサは、様々なドキュメントのシナリオと構成に対応するように設計されています。一般的な認識処理のシナリオは次のとおりです:
認識ジョブは、クライアント・ユーザーがドキュメントを含んだ大規模なバッチをスキャンしてリリースした後の後処理として実行されます。
認識ジョブは、バッチ内の各ページのバー・コードやパッチ・コードを検出します。
選択されたジョブのドキュメント編成方法に基づいて、認識プロセッサはバッチのページを個々のドキュメントに分割します。
認識ジョブは、バー・コード値、デフォルト値、または値をドキュメント・メタデータ・フィールドに適用することにより、ドキュメントに索引を付けます。
認識処理後の後処理ステップとして、バッチはコミット・プロセッサにリリースされます。
認識プロセスの基礎となる主な概念は次のとおりです:
ドキュメントを編成するために認識プロセッサが必要とするのは、バッチに単一のイメージ形式のドキュメントが含まれていることです(その単一ドキュメントが実際には複数のドキュメントで構成されている場合もあります)。バッチの処理時、認識プロセッサは、選択されたドキュメント編成方法に従ってバッチを論理ドキュメントに編成します。たとえば、各ドキュメントに固定数のページが含まれるように指定したり、ドキュメントの間にセパレータ・ページが含まれるように指定したりできます。
ドキュメントがすでに分割されており、バー・コード認識のみが必要なバッチの場合、ドキュメントの編成をスキップするように認識ジョブを構成できます。認識ジョブの「ドキュメント編成」ページでドキュメントの編成方法を指定します。次のいずれかの方法を選択できます:
ドキュメントごとの固定ページ数 (固定数のページを含むドキュメント用のジョブの構成)
各ページで同じバー・コード値 (各ページで同じバー・コード値を持つドキュメント用のジョブの構成)
セパレータ・ページ(ドキュメント間にセパレータ・ページがあるバッチ用のジョブの構成)
階層セパレータ・ページ(階層セパレータのあるドキュメントにジョブを構成)
なし: ドキュメント編成を実行しない(ドキュメントの編成を必要としないバッチ用のジョブの構成)
ドキュメント編成方法の他に、次の主要な相互関連認識ジョブ設定を使用すると、認識プロセッサで自動的にバー・コード認識、ドキュメント区切りおよび索引を実行できます:
認識ジョブを作成するときに、認識プロセッサがバー・コードを検出および識別する方法を指定できます:
「バー・コード認識」ページでは、デフォルトで「ユニバーサル・デコーダ」が選択されています。検出するバー・コード、バー・コードに固有の他の設定、およびパッチ・コード検出を指定します。認識プロセッサはすべてのページを検索して、ジョブで検出するように設定されたバー・コードを認識します。このページでは、次のオプションを使用できます:
表12-1 ユニバーサル・デコーダのオプション
オプション | 説明 |
---|---|
1次元コード |
認識プロセッサで検索する1次元バー・コード・シンボルのリストから選択します。 選択できる1次元コードは次のとおりです:
|
2次元コード |
認識プロセッサで検索する2次元バー・コード・シンボルを選択します。 選択できる2次元コードは次のとおりです:
|
イメージ当たりのバー・コードの最大数 |
イメージ当たりのバー・コードの最大数を0から10までの範囲で指定します。この設定で指定された値が検出された場合、または値を超えた場合、デコーダはイメージの処理を停止します。この設定は、システムのパフォーマンスを最適化するのに役立ちます。 デフォルトでは、このオプションは1に設定されています。 |
バー・コードの最小の高さ |
イメージに存在できるバー・コードの最小の高さを0.2から3までの範囲で指定します。 デフォルトでは、このオプションは0.5インチに設定されています。 この設定は、1次元バー・コードにのみ適用されます。 この設定は、斜め方向のバー・コードを認識するのに役立ちます。 |
メジャーの単位 |
「バー・コードの最小高さ」の設定と「バー・コード最大幅」の設定の単位をドロップダウン・リストから選択します。使用可能なオプションは、「インチ」および「cm」です。小数精度は3です。 |
バー・コードの最大の幅 |
イメージに存在できるバー・コードの最大の幅を、「バー・コードの最小高さ」から10までの範囲で指定します。 デフォルトでは、このオプションは2インチに設定されています。 この設定は、1次元バー・コードにのみ適用されます。 この設定は、斜め方向のバー・コードを認識するのに役立ちます。 |
バー・コードの最小文字数 |
処理時に考慮されるバー・コードの最小文字数を1から1000までの範囲で指定します。 デフォルトでは、このオプションは1に設定されています。 |
パッチ・コードとしてのバー・コードの解釈 |
この設定を使用して、バー・コード値をパッチ・コード・タイプにマップします。 指定されたバー・コード値が認識されると、バー・コード値としてではなくパッチ・コード・タイプとして解釈するように指定できます。 「パッチ・コード」の下にリストされる各パッチ・コード・タイプに隣接している「バー・コード値」テキスト・フィールドに英数字のバー・コード値を指定します。
ページ内の最初の一致のみパッチ・コードに変換されます。それ以外のバー・コードは、値がマッピングで指定された値と一致していても、パッチ・コードに変換されません。 バー・コード値の比較では大/小文字が区別されます。 |
注:
使い慣れている場合は、バー・コード・シンボルを選択することをお薦めします。シンボルを使用すると、パフォーマンスが向上し、処理を妨げる可能性のある不明なバー・コードが検出されるリスクが減ります。
「バー・コード定義」ページで、長さ(文字数)などの特性によってバー・コードを識別する1つ以上のバー・コード定義を指定します。バー・コード定義を作成する場合、次の検証ルールから選択できます:
長さ
マスク
正規表現
選択リスト (ページ上のバー・コードが、選択した選択リストに含まれる値と一致する必要があります)
なし
認識プロセッサにより認識されたバー・コードが検証条件を満たした場合、それらはバー・コード定義に割り当てられます。メタデータの割当て時やページの分割時など、ジョブでこれらのバー・コード定義を様々な方法で使用します。バー・コード定義の管理の詳細は、バー・コード定義の追加または編集を参照してください。
ドキュメントの区切り(バー・コードやパッチ・コードのセパレータを含む)を定義するための様々なオプションが使用可能です。
「ドキュメント処理」ページで指定するドキュメント区切りオプションは、選択したドキュメント編成オプションによって異なります(ドキュメント編成方法を参照)。
ドキュメントに一定数のページを含むことを指定する場合は、ドキュメント当たりのページ数も指定する必要があります。ジョブでこの数に達すると、新規のドキュメントが識別され、バッチ内の次のドキュメントのカウントが再開されます。セパレータは必要ありません。
ドキュメントの各ページに同じバー・コード値を含むことを指定する場合は、区切りに使用するバー・コード定義を指定する必要があります。異なるバー・コード値を含むバー・コード定義がジョブで見つかると、新規のドキュメントが作成されます。セパレータは必要ありません。
セパレータ・ページに基づいてドキュメントを編成することを指定する場合は、単独セパレータまたは階層セパレータのいずれであっても、バー・コードやパッチ・コードのセパレータ・ルールを指定する必要があります。
ドキュメント編成を実行しないことを指定した場合、前のドキュメント区切りが保持されます。特定の非定型的な構成においては、オプションでセパレータを使用できます。
「ドキュメント処理」ページで使用可能なオプションを使用して、作成したドキュメントにソース・ドキュメントの添付を含めるかどうか、および含める方法を指定できます。「ソース・ドキュメントの添付」フィールドで使用可能な次のオプションから選択できます:
作成したドキュメントにソース・ドキュメントのすべての添付を含める場合は、「すべての添付を作成されたドキュメントに含める」(デフォルト)オプションを選択します。
ドキュメント・プロファイルで指定された添付タイプと一致するソース・ドキュメントのすべての添付を含める場合は、「一致するドキュメント・プロファイル添付タイプの添付を含める」オプションを選択します。
作成したドキュメントにソース・ドキュメントの添付を含めない場合は、「添付を含めない」オプションを選択します。
注:
「ドキュメント編成」ページで「なし: ドキュメント編成を実行しない」オプションを選択している場合、「ドキュメント処理」ページで「ソース・ドキュメントの添付」フィールドは使用できません。ドキュメントを処理するとき、認識プロセッサは、ドキュメントの索引付けに使用可能なメタデータ・フィールドを識別するために使用するドキュメント・プロファイルを決定します。「ドキュメント・プロファイル」ページで、認識ジョブでドキュメントの処理時にドキュメント・プロファイルをドキュメントに割り当てる方法を指定します。静的なドキュメント・プロファイルまたは動的に決定されるドキュメント・プロファイルの指定を参照してください。選択したドキュメント編成方法によって、ドキュメント・プロファイルの割当てオプションが影響を受けます。次のようなドキュメント・プロファイル割当てを選択できます:
静的: 「デフォルトのドキュメント・プロファイル」フィールドに入力します。
「動的に決定しない」フィールドが選択されている場合、または動的に決定される一致するドキュメント・プロファイルが見つからなかった場合は、認識ジョブでデフォルトのドキュメント・プロファイルが使用されます。
動的に決定: ドキュメント編成に応じて、バー・コードまたはセパレータ・ページ値に基づいて決定されます。
「フィールド」ページでメタデータ値を割り当てるように認識ジョブを構成したり、バー・コード値、バッチ名、デフォルト値、スキャン日付、または索引日付のいずれかの値を自動移入するようプロシージャのメタデータ・フィールドを構成できます。
「後処理」ページで使用可能な設定を適用して、認識処理の完了後に実行する処理を指定できます:
システム・エラーが発生していない場合、次のバッチ・プロセッサを指定し、該当する場合は、実行するジョブも指定します。たとえば、次のステップとしてコミット・プロセッサを設定します。また、後処理アクションに「なし」を指定することもできます。(「なし」を選択した場合は、クライアントがバッチを処理する必要があります。たとえば、クライアントがバッチの正確性をレビューし、そのバッチをコミット・プロセッサにリリースする場合などです。)また、認識処理が正常に完了した後に、電子メール通知を送信し、バッチ名、ステータスおよび優先度を変更することもできます。
1つ以上のシステム・エラーが発生した場合、次のバッチ・プロセッサを指定し、該当する場合は、実行するジョブも指定します。「なし」を選択すると、バッチが索引付けのためにクライアント・ユーザーにリリースされます。また、認識処理のシステム・エラーが発生したときに、電子メール通知を送信し、バッチ名、ステータスおよび優先度を変更して適切な担当者に通知することもできます。
これらは、認識プロセッサ・ジョブの使用時に実行する一般的なタスクです。(特定のタイプの認識ジョブの構成の詳細は、ドキュメント編成に基づいたジョブの構成を参照してください。)
選択したプロシージャの構成ページが右側に表示されます。
「処理」タブを開きます。
「認識プロセッサ・ジョブ」表で、をクリックして、ジョブを作成します。ジョブを編集するには、それを選択してをクリックします。
また、認識ジョブをコピーするには、それを選択してをクリックし、プロンプトが表示されたら新規の名前を入力します。ジョブをコピーすると、すばやく複製および変更できます。
「一般設定」ページで、ジョブの名前を入力します。
「バー・コード認識」ページで、バー・コード認識に固有の設定を指定し、認識ジョブで検出するバー・コード・タイプ(シンボル)を識別します。
バー・コード・シンボルを使用すると、パフォーマンスが向上し、処理を妨げる可能性のある不明なバー・コードが検出されるリスクが減ります。
「バー・コード定義」ページで、バー・コード定義を追加します。
バックグラウンド情報については、バー・コードとパッチ・コードを検出および識別するための設定を参照してください。ステップについては、バー・コード定義の追加または編集を参照してください。
「ドキュメント編成」ページで、バッチ内のドキュメントの構成方法を指定します。
ドキュメント編成方法を参照してください。
「ドキュメント・プロファイル」ページで、ドキュメント・プロファイルを指定するか、ドキュメント・プロファイルが動的に決定されるように構成します。表示される設定は、選択したドキュメント編成方法に基づいています。デフォルトのドキュメント・プロファイルを選択する必要があります。
バックグラウンド情報については、ドキュメントを分類するための設定を参照してください。ステップについては、静的なドキュメント・プロファイルまたは動的に決定されるドキュメント・プロファイルの指定を参照してください。
「ドキュメント処理」ページで、ドキュメントの区切りおよび処理の方法を指定します。使用可能な設定は、選択したドキュメント編成方法に基づいています。ドキュメントを単独セパレータまたは階層セパレータで区切る場合は、バー・コードまたはパッチ・コードのセパレータ・ルールを構成します。
バックグラウンド情報については、ドキュメントを区切るための設定を参照してください。ステップについては、セパレータ・ページ定義の構成を参照してください。
このページでは、「ドキュメント編成」ページでドキュメント編成方法を選択した場合に添付を含めるかどうかも指定できます。添付を処理するための設定を参照してください。
「フィールド」ページで、ドキュメントごとに、メタデータ・フィールドに自動入力されるようにバー・コードまたは他の値を設定します。
「後処理」ページで、認識処理の完了後に実行する処理を指定します。
TIFFへの変換ジョブの後処理および監視の構成を参照してください。
「サマリー」ページの設定を確認し、「送信」をクリックします。
認識プロセッサ・ジョブをテストします。
認識ジョブを削除すると、このジョブが後処理ステップとして設定されているバッチにこのジョブは使用できなくなります。認識ジョブを削除する前に、オフラインにして予期しない問題を解決することをお薦めします。オンラインの認識ジョブは、クライアント・プロファイルまたはプロセッサ・ジョブの「後処理」ページで選択されている場合に実行されます。ジョブの実行を一時的に停止(オフラインにする)したり、非アクティブ化されたジョブを変更して再度実行できます。
認識ジョブの後処理オプションを使用すると、処理の完了後に実行する処理を指定できます。このプロシージャ内に構成する設定は、成功したバッチと失敗したバッチとで別々に指定します。
後処理設定を構成するには:
認識ジョブを実行するには、処理のためにジョブに送られるようにバッチを構成する必要があります。これを行うには、クライアント・プロファイルまたは他のプロセッサ・ジョブ内で認識プロセッサ・ジョブを後処理ステップとして指定します。
クライアント・プロファイルからバッチ・フローを構成する場合は、クライアント・プロファイルの後処理の構成を参照してください。
インポート・プロセッサ・ジョブからバッチ・フローを構成する場合は、インポート・プロセッサ・ジョブの後処理の構成を参照してください。
PDFまたはTIFFへの変換ジョブからバッチ・フローを構成するには、PDFへの変換ジョブへのバッチ・フローの構成およびTIFFへの変換ジョブへのバッチ・フローの構成を参照してください。
たとえば、ドキュメントをバッチにスキャンしてから認識処理用にリリースするためのクライアント・プロファイルを作成します。また、まず電子メール・メッセージとそのPDF添付をインポートしてから、それをイメージ形式に変換するために変換プロセッサに送信し、最終的に認識処理のためにドキュメントを送信するインポート・プロセッサ・ジョブを作成することもできます。
ドキュメント編成のスキップを計画していないかぎり、認識プロセッサではバッチに単一のイメージ形式ドキュメントが含まれていることが期待されます(ドキュメント編成方法を参照)。