機械翻訳について

認識プロセッサ・ジョブの構成

認識プロセッサを使用すると、プロシージャでイメージ・ドキュメントのバー・コードの認識、ドキュメントの分割および索引付けを自動化できます。

認識処理について、また認識ジョブの構成方法および管理方法について学習するには、次を参照してください:

認識処理について

認識プロセッサは、様々なドキュメントのシナリオと構成に対応するように設計されています。 一般的な認識処理のシナリオは次のとおりです:

  1. 認識ジョブは、クライアント・ユーザーがドキュメントを含んだ大規模なバッチをスキャンしてリリースした後の後処理として実行されます。

  2. 認識ジョブでは、バッチ内の各ページでバー・コードまたはパッチ・コード(あるいはその両方)を検出します。

  3. 選択されたジョブのドキュメント編成方法に基づいて、認識プロセッサはバッチのページを個々のドキュメントに分割します。

  4. 認識ジョブは、バー・コード値、デフォルト値、または値をドキュメント・メタデータ・フィールドに適用することにより、ドキュメントに索引を付けます。

  5. 認識処理後の後処理ステップとして、バッチはコミット・プロセッサにリリースされます。

認識プロセスの基礎となる主な概念は次のとおりです:

ドキュメント編成方法

ドキュメントを編成するために認識プロセッサが必要とするのは、バッチに単一のイメージ形式のドキュメントが含まれていることです(その単一ドキュメントが実際には複数のドキュメントで構成されている場合もあります)。 バッチの処理時、認識プロセッサは、選択されたドキュメント編成方法に従ってバッチを論理ドキュメントに編成します。 たとえば、各ドキュメントに固定ページ数が含まれるか、ドキュメントにセパレータ・ページが含まれるかを指定できます。

ドキュメントがすでに分割されており、バー・コード認識のみが必要なバッチの場合、ドキュメントの編成をスキップするように認識ジョブを構成できます。 認識ジョブの「ドキュメント編成」ページでドキュメントの編成方法を指定します。 次の方法のいずれかを選択できます。

その他の主要な認識プロセッサ・ジョブ設定

「ドキュメント組織メソッド」に加えて、認識プロセッサが自動バーコード認識、ドキュメントの分離および索引を実行できるようにする他の主要な相互関連認識ジョブ設定は次のとおりです:

バー・コードとパッチ・コードを検出および識別するための設定

認識ジョブを作成するときに、認識プロセッサがバー・コードを検出および識別する方法を指定できます:

  • 「バー・コード認識」ページでは、デフォルトで「ユニバーサル・デコーダ」が選択されています。 検出するバー・コード、バー・コードに固有の他の設定、およびパッチ・コード検出を指定します。 認識プロセッサはすべてのページを検索して、ジョブで検出するように設定されたバー・コードを認識します。 このページでは、次のオプションを使用できます:

    表12-1 ユニバーサル・デコーダのオプション

    オプション 説明

    1次元コード

    認識プロセッサで検索する1次元バー・コード・シンボルのリストから選択します。

    選択できる1次元コードは次のとおりです:

    • コード 128

    • コード 39

    2次元コード

    認識プロセッサで検索する2次元バー・コード・シンボルを選択します。

    選択できる2次元コードは次のとおりです:

    • PDF417

    • QRコード

    イメージ当たりのバー・コードの最大数

    イメージ当たりのバー・コードの最大数(0から10)を指定します。 デコーダは、この設定に指定された値を検出または超えるとイメージの処理を停止します。 この設定は、システム・パフォーマンスの最適化に役立ちます。

    デフォルトでは、このオプションは1に設定されています。

    バー・コードの最小の高さ

    イメージに存在できる最も短いバー・コードの高さ(0.2インチから3インチ)を指定します。

    デフォルトでは、このオプションは0.5インチに設定されています。

    この設定は、1次元バー・コードにのみ適用されます。

    この設定は、斜め方向のバー・コードを認識するのに役立ちます。

    単位

    「バー・コードの最小高さ」設定と「バー・コード最大幅」設定の単位をドロップダウン・リストから選択します。 使用可能なオプションは、「インチ」および「cm」です。 小数精度は3です。

    バー・コードの最大の幅

    イメージに存在できる最も広いバー・コードの最大幅(バー・コードの最小高さから10インチ)を指定します。

    デフォルトでは、このオプションは2インチに設定されています。

    この設定は、1次元バー・コードにのみ適用されます。

    この設定は、斜め方向のバー・コードを認識するのに役立ちます。

    バー・コードの最小文字数

    処理時に考慮されるバー・コードの最小文字数(1から1000)を指定します。

    デフォルトでは、このオプションは1に設定されています。

    パッチ・コードとしてのバー・コードの解釈

    この設定を使用して、バー・コード値をパッチ・コード・タイプにマップします。

    指定されたバー・コード値が認識されると、バー・コード値としてではなくパッチ・コード・タイプとして解釈するように指定できます。

    「パッチ・コード」にリストされる各パッチ・コード・タイプに隣接している「バー・コード値」テキスト・フィールドに英数字のバー・コード値を指定します。

    • I

    • II

    • III

    • IV

    • VI

    • T

    ページ内の最初の一致のみパッチ・コードに変換されます。 それ以外のバー・コードは、値がマッピングで指定された値と一致していても、パッチ・コードに変換されません。

    バー・コード値の比較では大/小文字が区別されます。

    ノート:

    使い慣れている場合は、バー・コード・シンボルを選択することをお薦めします。 シンボルを使用すると、パフォーマンスが向上し、処理を妨げる可能性のある不明なバー・コードが検出されるリスクが減ります。

  • 「バー・コード定義」ページで、長さ(文字数)などの特性によってバー・コードを識別する1つ以上のバー・コード定義を指定します。 バー・コード定義を作成する場合、次の検証ルールから選択できます:

    • Length

    • マスク

    • 正規表現

    • 選択リスト (ページのバー・コードは、選択された選択リストに含まれている値に一致する必要があります)

    • なし

    認識プロセッサにより認識されたバー・コードが検証条件を満たした場合、それらはバー・コード定義に割り当てられます。 メタデータの割当て時やページの分割時など、ジョブでこれらのバー・コード定義を様々な方法で使用します。 バーコード定義の管理の詳細は、「バーコード定義の追加または編集」を参照してください。

ドキュメントを区切るための設定

ドキュメントの区切り(バー・コードやパッチ・コードのセパレータを含む)を定義するための様々なオプションが使用可能です。

「ドキュメント処理」ページで指定するドキュメントの分離オプションは、選択したドキュメント編成メソッドによって異なります(「ドキュメント組織メソッド」を参照)。

  • ドキュメントに一定数のページを含むことを指定する場合は、ドキュメント当たりのページ数も指定する必要があります。 ジョブがこの数に達すると、新しいドキュメントが識別され、バッチ内の次のドキュメントのカウントが再開されます。 セパレータは必要ありません。

  • ドキュメントがページごとに同じバー・コード値を含むことを指定する場合は、分割に使用するバー・コード定義を指定する必要があります。 ジョブが異なるバー・コードを持つバー・コード定義を検出する場合は、新しいドキュメントが作成されます。 セパレータは必要ありません。

  • セパレータ・ページ(単一セパレータまたは階層セパレータ)に基づいてドキュメントが編成されることを指定する場合は、バー・コードまたはパッチ・コード(あるいはその両方)のセパレータ・ルールを指定する必要があります。

  • ドキュメント編成を実行しないことを指定した場合、前のドキュメント区切りはそのまま残ります。 通常の構成では、オプションでセパレータを使用できます。

添付を処理するための設定

「ドキュメント処理」ページで使用可能なオプションを使用して、作成したドキュメントにソース・ドキュメントの添付を含めるかどうか、および含める方法を指定できます。 「ソース・ドキュメントの添付」フィールドで使用可能な次のオプションから選択できます。

  • 作成したドキュメントにソース・ドキュメントのすべての添付を含める場合は、「すべての添付を作成されたドキュメントに含める」(デフォルト)オプションを選択します。

  • 「一致するドキュメント・プロファイル添付タイプの添付ファイルを含める」オプションは、ドキュメント・プロファイルに指定されている添付タイプと一致するソース・ドキュメントのすべての添付ファイルを含める場合に選択します。

  • 「添付を含めない」オプションは、ソース・ドキュメントの添付を作成されたドキュメントに含めない場合に選択します。

ノート:

「ドキュメント組織」ページで「なし: ドキュメント組織を実行しない」オプションが選択されている場合、「ドキュメント処理」ページでは「ソース・ドキュメント添付」フィールドを使用できません。
ドキュメントを分類するための設定

ドキュメントを処理するとき、認識プロセッサは、ドキュメントの索引付けに使用可能なメタデータ・フィールドを識別するために使用するドキュメント・プロファイルを決定します。 「ドキュメント・プロファイル」ページで、認識ジョブでドキュメントの処理時にドキュメント・プロファイルをドキュメントに割り当てる方法を指定します。 「静的または動的に決定されるドキュメント・プロファイルの指定」を参照してください。 選択したドキュメント編成方法は、ドキュメント・プロファイルの割当てオプションに影響を及ぼします。 次のドキュメント・プロファイルの割当てを選択できます。

  • 静的: 「デフォルトのドキュメント・プロファイル」フィールドに入力します。

    認識ジョブは、「動的に決定しない」フィールドが選択されている場合、または一致する動的に決定されたドキュメント・プロファイルが見つからない場合に、デフォルトのドキュメント・プロファイルを使用します。

  • 動的に決定: ドキュメントの編成に応じて、バー・コードまたはセパレータ・ページ値を基づきます。

メタデータ値を割り当てるための設定

「フィールド」ページでメタデータ値を割り当てるように認識ジョブを構成したり、バー・コード値、バッチ名、デフォルト値、スキャン日付、または索引日付のいずれかの値を自動移入するようプロシージャのメタデータ・フィールドを構成できます。

認識処理後の後処理設定

「後処理」ページで使用可能な設定を適用して、認識処理の完了後に実行する処理を指定できます:

  • システム・エラーが発生していない場合、次のバッチ・プロセッサを指定し、該当する場合は、実行するジョブも指定します。 たとえば、次のステップとしてコミット・プロセッサを設定します。 後処理アクションを行わない場合は、「なし」を指定することもできます。 (「なし」を選択した場合は、クライアントがバッチを処理する必要があります。 たとえば、クライアントがバッチの正確性をレビューし、そのバッチをコミット・プロセッサにリリースする場合などです。) また、認識処理が正常に完了した後に、電子メール通知を送信し、バッチ名、ステータスおよび優先度を変更することもできます。

  • 1つ以上のシステム・エラーが発生した場合、次のバッチ・プロセッサを指定し、該当する場合は、実行するジョブも指定します。 「なし」を選択すると、バッチが索引付けのためにクライアント・ユーザーにリリースされます。 認識処理システム・エラーが発生した場合は、該当するユーザーに警告するために、電子メール通知を送信したり、バッチ名、ステータス、優先度を変更したりすることもできます。

一般的な認識プロセッサ・ジョブ設定の構成

これらは、認識プロセッサ・ジョブの使用時に実行する一般的なタスクです。 (特定のタイプの認識ジョブの構成の詳細は、「ドキュメント組織に基づくジョブの構成」を参照してください。)

認識ジョブの追加または編集

認識ジョブを追加または編集するには:
  1. 左側のプロシージャ・ペインで、プロシージャを選択します。

    選択したプロシージャの構成ページが右側に表示されます。

  2. 「処理」タブを開きます。

  3. 「認識プロセッサ・ジョブ」表で、認識ジョブの追加をクリックしてジョブを作成します。 ジョブを選択して認識ジョブの編集をクリックすると、ジョブを編集できます。

    認識ジョブをコピーするには、ジョブを選択して認識ジョブのコピーをクリックし、プロンプトが表示されたら新しい名前を入力します。 ジョブのコピーにより、すばやく複製し変更できます。

  4. 「一般設定」ページで、ジョブの名前を入力します。

  5. 「バー・コード認識」ページで、バー・コード認識に固有の設定を指定し、認識ジョブで検出するバー・コード・タイプ(シンボル)を識別します。

    バー・コード・シンボルを使用すると、パフォーマンスが向上し、処理を妨げる可能性のある不明なバー・コードが検出されるリスクが減ります。

  6. 「バー・コード定義」ページで、バー・コード定義を追加します。

    バックグラウンド情報については、「バーコードとパッチ・コードを検出および識別するための設定」を参照してください。 ステップについては、「バーコード定義の追加または編集」を参照してください。

  7. 「ドキュメント編成」ページで、バッチ内のドキュメントの構成方法を指定します。

    「ドキュメント組織メソッド」を参照してください。

  8. 「ドキュメント・プロファイル」ページで、ドキュメント・プロファイルを指定するか、ドキュメント・プロファイルが動的に決定されるように構成します。 表示される設定は、選択したドキュメント編成方法に基づいています。 デフォルトのドキュメント・プロファイルを選択する必要があります。

    バックグラウンド情報については、「ドキュメントの分類の設定」を参照してください。 ステップについては、「静的または動的に決定されるドキュメント・プロファイルの指定」を参照してください。

  9. 「ドキュメント処理」ページで、ドキュメントの区切りおよび処理の方法を指定します。 使用可能な設定は、選択したドキュメント編成方法に基づいています。 ドキュメントを単独セパレータまたは階層セパレータで区切る場合は、バー・コードまたはパッチ・コードのセパレータ・ルールを構成します。

    バックグラウンド情報については、「ドキュメントの区切りの設定」を参照してください。 ステップについては、「セパレータ・ページ定義の構成」を参照してください。

    このページでは、「ドキュメント編成」ページでドキュメント編成方法を選択した場合に添付を含めるかどうかも指定できます。 「添付の処理の設定」を参照してください。

  10. フィールド・ページで、ドキュメントごとに「バーコードまたはその他の値を設定して、メタデータ・フィールドに自動移入」を指定します。

  11. 「後処理」ページで、認識処理の完了後に実行する処理を指定します。

    「変換ジョブのTIFFへの後処理およびモニタリングの構成」を参照してください。

  12. 「サマリー」ページの設定を確認し、「送信」をクリックします。

  13. バッチが認識プロセッサ・ジョブへ送られる方法を構成します

  14. 認識プロセッサ・ジョブをテストします。

認識ジョブの非アクティブ化または削除

認識ジョブを削除すると、このジョブが後処理ステップとして設定されているバッチにこのジョブは使用できなくなります。 認識ジョブを削除する前に、オフラインにして予期しない問題を解決することをお薦めします。 オンラインの認識ジョブは、クライアント・プロファイルまたはプロセッサ・ジョブの「後処理」ページで選択されている場合に実行されます。 ジョブは一時的に実行を停止(オフライン)したり、非アクティブのジョブを再度実行することができます。

ノート:

バッチ処理ジョブは、別のバッチ・プロセッサで後処理ジョブとして構成されている場合は削除できません。
認識ジョブを非アクティブ化または削除するには:
  1. 左側のプロシージャ・ペインで、プロシージャを選択します。
    選択したプロシージャの構成ページが右側に表示されます。
  2. 「処理」タブを開きます。
  3. 「認識プロセッサ・ジョブ」表で、最初に非アクティブ化するジョブを選択し、認識ジョブを非アクティブ化またはアクティブ化をクリックします。

    認識ジョブを非アクティブにしたり、アクティブにするには、「一般設定」ページで「オンライン」フィールドを選択したり、選択解除して、ジョブを非アクティブにしたり、アクティブにすることもできます。

  4. 「認識プロセッサ・ジョブ」表で、非アクティブ化されたジョブを選択し、認識ジョブを削除をクリックします。
  5. プロンプトが表示されたら、「はい」をクリックしてこの認識ジョブを削除することを確認します。

認識プロセッサ・ジョブの後処理および監視の構成

認識ジョブの後処理オプションを使用すると、処理の完了後に実行する処理を指定できます。 このプロシージャ内に構成する設定は、成功したバッチと失敗したバッチとで別々に指定します。

後処理設定を構成するには:

  1. 認識プロセッサ・ジョブを追加または編集します
  2. 「後処理」ページをクリックして、成功した処理(システム・エラーなし)および失敗した処理(1つ以上のシステム・エラー)に対する処理オプションを表示します。
  3. 「バッチ・プロセッサ」および「バッチ・プロセッサ・ジョブ」フィールドで、ある場合には、認識処理の完了後の処理ステップを指定します。 プロシージャに対して定義したバッチ・プロセッサ・ジョブのみを選択できます。 たとえば、認識プロセッサ・ジョブを定義しなかった場合、「バッチ・プロセッサ」フィールドでは認識プロセッサ・オプションを使用できません。 「バッチ・プロセッサ」フィールドで認識プロセッサまたはTIFF/PDFへの変換を選択した場合は、対応するプロセッサ・ジョブを指定します。

    たとえば、システム・エラーがないバッチをコミット・プロセッサに送信できます。 システム・エラーがあるバッチに「なし」を指定し、バッチ・ステータスまたは接頭辞を変更してクライアントでのその後の処理に利用できます。

  4. 電子メール・アドレスのフィールドに、オプションで、処理が正常に完了または失敗した後に電子メールを送信する宛先のアドレスを入力します。 認識プロセッサ・ジョブを構成およびテストしている間は、システム・エラーの発生時に自分に電子メール通知が送信されるように設定してください。 また、その後で管理者に処理エラーが自動的に通知されるようにしてください。
  5. 残りのフィールドで、処理済のバッチを変更する方法について指定します。
    • 接頭辞を追加して、バッチの名前を変更します。 たとえば、失敗したバッチの名前を、追跡用に接頭辞ERRを付けて変更します。

    • バッチ・ステータスまたは優先度を変更します。 たとえば、システム・エラーのバッチのステータスを変更し、バッチ・フィルタリングをこのステータスに設定したクライアント・プロファイルを作成して、資格のあるユーザーがエラーの発生したバッチを手動で編集および完成できるようにできます。

  6. ジョブを保存するには、「送信」をクリックします。

認識プロセッサ・ジョブへのバッチ・フローの構成

認識ジョブを実行するには、処理用ジョブにフローするようバッチを構成する必要があります。 これを行うには、認識プロセッサ・ジョブを「クライアント・プロファイル」「インポート・プロセッサ・ジョブ」、または「処理設定」で説明されている処理ジョブの後処理ステップとして識別します。 (「処理設定の構成」または「取得設定の構成」の下の、バッチ・フローを構成するジョブまたはクライアント・プロファイルの後処理情報を参照してください。) たとえば、ドキュメントをバッチにスキャンしてから認識処理用にリリースするためのクライアント・プロファイルを作成します。 また、まず電子メール・メッセージとそのPDF添付をインポートしてから、それをイメージ形式に変換するために変換プロセッサに送信し、最終的に認識処理のためにドキュメントを送信するインポート・プロセッサ・ジョブを作成することもできます。

ドキュメントの編成をスキップする予定がないかぎり、認識プロセッサは、「ドキュメント組織メソッド」の説明に従って、バッチにイメージ形式の単一のドキュメントが含まれていることを想定します。