ドキュメント編成に基づいたジョブの構成

様々な編成タイプの認識ジョブを構成する方法は次のとおりです:

固定数のページを含むドキュメント用のジョブの構成

このドキュメント編成方法では、バッチには固定ページ数のドキュメントが含まれます。ジョブの「ドキュメント処理」ページで、ドキュメントごとのページ数と、バー・コードを読み取るドキュメント内のページ数を指定します。

この編成方法の例は次のとおりです:
  • 各ページにバー・コードが存在し、各ページが一意のドキュメントを表す1ページのドキュメント。この例では、各ページにバー・コードが含まれている必要があり、(バー・コードが見つからないか認識されない)ページ3は手動でデータを入力する必要があります。

  • 両面モードでスキャンされたページの表と裏などの2ページのドキュメント。通常、ドキュメントの最初のページにバー・コードが含まれていますが、ページの裏側が最初に誤ってスキャンされた場合、2ページ目にバー・コードが含まれます。

  • 固定数のページで構成されるフォーム・ドキュメント。たとえば、組織のビジネス契約が常に5ページで構成される場合などです。ページ数が不明な場合、または添付がドキュメントでスキャンされる場合は、セパレータ・ページ方法を使用する必要がある場合があります。

固定数のページを含むドキュメントの認識ジョブを構成するには:

  1. 「処理」タブで、認識プロセッサ・ジョブを追加または編集します。

  2. 「ドキュメント編成」ページで「ドキュメントごとの固定ページ数」方法を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バー・コード定義」ページで、バー・コードの検出方法を構成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトのドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(ドキュメント・プロファイルの追加または編集)を選択し、認識ジョブに適用するメタデータ・フィールドのグループを指定します。選択したバー・コードを使用して、ドキュメント・プロファイルを動的に決定できます。

  6. 「ドキュメント処理」ページで、「ドキュメント編成」ページで編成が設定された「ドキュメントごとの固定ページ数」ジョブに固有の設定を完了します。

    1. 「ドキュメントごとのページ数」フィールドに、各ドキュメントに含める固定ページ数を入力します。

    2. 「バー・コードを読み取るドキュメントごとのページ数」フィールドに数値を指定します。

      この設定は、各ドキュメントの指定された最初からのページ数でバー・コード認識を実行することにより、パフォーマンスを最適化します。たとえば、バー・コードが10ページ中の3ページ目にある場合は、3を指定して、各ドキュメントの最初の3ページでバー・コードが認識されるようにします。また、このフィールドを使用して、それより後のドキュメント・ページの競合するバー・コードが無視されるようにすることもできます。

    3. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドでアクション(最初に見つかった値を使用、バー・コード値を上書き、バー・コード値をクリア)を指定します。

    4. 作成したドキュメントにソース・ドキュメントの添付を含める方法を指定します。

  7. 「フィールド」ページでメタデータ割当て設定を構成します。

  8. 「送信」をクリックし、認識ジョブの機能をテストします。

各ページで同じバー・コード値を持つドキュメント用のジョブの構成

このドキュメント編成方法では、バッチは複数のページ・ドキュメントで構成され、1つのドキュメントの各ページに同じバー・コード値が含まれます。したがって、ページ間のバー・コード値の変化は、新しいドキュメントの始まりを示します。たとえば、顧客契約書には、各ページに顧客IDバー・コードが含まれています。

ジョブの「ドキュメント処理」ページで、ジョブがドキュメントの区切りを決定するために使用するバー・コードとドキュメント当たりの最大ページ数を指定します。

各ページに同じバー・コード値を持つドキュメント用にジョブを構成するには:

  1. 「処理」タブで、認識プロセッサ・ジョブを追加または編集します。

  2. 「ドキュメント編成」ページで、「各ページに同じバー・コード値」編成を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バー・コード定義」ページで、バー・コードの検出方法を構成します。少なくとも、ドキュメントの分割を決定するバー・コードの定義を作成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトのドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(ドキュメント・プロファイルの追加または編集)を選択し、認識ジョブに適用するメタデータ・フィールドのグループを指定します。選択したバー・コードを使用して、ドキュメント・プロファイルを動的に決定できます。

  6. 「ドキュメント処理」ページで、選択したドキュメント編成(各ページに同じバー・コード値)に固有の設定を完了します。

    1. 「ドキュメント区切りを決定するバー・コード」フィールドで、ステップ4で作成したバー・コード定義を選択します。

    2. 「ドキュメントごとの最大ページ数」フィールドに数値を指定して、ドキュメントで許可されるページ数を制限します。これはオプションのフィールドです。ドキュメント当たりの最大ページ数の指定をスキップするには、0を指定します。

    3. 「処理オプション」フィールドで、オプションで「オプティミスティック・バー・コード検出」機能を有効にします。バー・コードが読み取れないか、ページに存在せず、この機能がアクティブな場合、認識プロセッサは前のページと次のページの値を比較し、それに応じて値を割り当てます。

      たとえば、3ページのバッチに、バー・コードAが指定された1ページ目、バー・コードがない2ページ目およびバー・コードAが指定された3ページ目があるとします。オプティミスティック・バー・コード検出機能が有効な場合、認識プロセッサは3つのページすべてを同じドキュメントにグループ化します。有効でない場合、1ページ目と3ページ目は1つのドキュメントにグループ化され、2ページ目は除外されます。

    4. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドでアクション(最初に見つかった値を使用、バー・コード値を上書き、バー・コード値をクリア)を指定します。

    5. 作成したドキュメントにソース・ドキュメントの添付を含める方法を指定します。

  7. 「フィールド」ページでメタデータ割当て設定を構成します。

  8. 「送信」をクリックし、認識ジョブの機能をテストします。

ドキュメント間にセパレータ・ページがあるバッチ用のジョブの構成

ドキュメント編成方法として「セパレータ・ページ」が選択されている場合、バッチは、ドキュメント・セパレータ・ページで区切られた複数ページ・ドキュメントで構成されます。(ドキュメント・セパレータの階層レベル用のドキュメントの編成については、階層セパレータのあるドキュメントにジョブを構成で説明されています。)この編成タイプを使用する場合:

  • セパレータ・ページは、新しいドキュメントの始まりを示します。セパレータ・ページは、ドキュメントに保持したり、ドキュメントから削除できます。

  • セパレータ・ページには、新しドキュメントを示すバー・コードやパッチ・コードを含めることができます。

  • セパレータ・ページの検出方法を規定したルールを作成します。たとえば、ドキュメントの分割が行われるのは、指定したバー・コードまたはパッチ・コードのいずれかが検出されたときか、両方を検出する必要があるかを構成します。セパレータ・ページ定義の構成を参照してください。

ドキュメント間にセパレータ・ページがあるバッチ用にジョブを構成するには:

  1. 「処理」タブで、認識プロセッサ・ジョブを追加または編集します。

  2. 「ドキュメント編成」ページで「セパレータ・ページ」方法を選択します。(この方法は、デフォルトのドキュメント編成です。)

  3. 「バー・コード認識」ページで、バー・コード記号が認識されるように構成します。

  4. 「バー・コード定義」ページで、処理するドキュメントのバー・コード設定を構成します。セパレータ・ページ・バー・コードや、ドキュメント・プロファイルまたはメタデータ値を提供する可能性のあるその他のバー・コードを含む、すべてのバー・コードを構成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトのドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(ドキュメント・プロファイルの追加または編集)を選択し、認識ジョブに適用するメタデータ・フィールドのグループを指定します。選択したバー・コードを使用して、ドキュメント・プロファイルを動的に決定できます。

  6. 「ドキュメント処理」ページで、選択したドキュメント編成(セパレータ・ページ)に固有の設定を完了します。

    1. 「構成」をクリックしてセパレータ・ページを構成します。

    2. 「ドキュメントごとの最大ページ数」フィールドに数値を指定して、ドキュメントで許可されるページ数を制限します。これはオプションのフィールドです。ドキュメント当たりの最大ページ数の指定をスキップするには、0を指定します。

      このフィールドは、欠落しているセパレータ・ページまたは認識に失敗したセパレータ・ページの検出に役立ちます。認識プロセッサがこの数に達すると、最後の有効なドキュメントと検出された次のセパレータ・シートの間にあるイメージが手動による索引付けのためにバッチ内に残ります。たとえば、ジョブのバッチ内にある各ドキュメントが25ページを超えないことがわかっている場合は、この数を入力して、ドキュメント・セパレータ・ページが検出されないか、欠落している場合に、複数のドキュメントが結合されないようにします。

    3. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドでアクション(最初に見つかった値を使用、バー・コード値を上書き、バー・コード値をクリア)を指定します。

    4. 作成したドキュメントにソース・ドキュメントの添付を含める方法を指定します。

  7. 「送信」をクリックし、認識ジョブの機能をテストします。

階層セパレータのあるドキュメントにジョブを構成

認識プロセッサの階層セパレータ機能を使用すると、レベルの階層内でドキュメントを処理および編成できます。たとえば、フォルダ・レベルとドキュメント・レベルの2レベルの階層を使用すると、次のフォルダ・レベルのセパレータ・ページが検出されるまで、ドキュメントは高い方のレベルのフォルダ・メタデータ値を継承します。

階層セパレータは、フォルダや箱に保管している大量のドキュメントをデジタル化するバック・ファイル変換の構成に特に役立ちます。サードパーティ・アプリケーションで、必要な階層セパレータ・ページを生成できます。作成者はこれを挿入して、大量のドキュメント、フォルダや箱をスキャンおよび認識処理する準備をします。

注:

  • ドキュメント・セパレータが検出されたが、メタデータ値が取得されなかった場合、誤ったメタデータ値がドキュメントに誤って適用されるのを防ぐために、該当するレベル以下ですべてのメタデータ値がクリアされます。

  • 階層セパレータ・ページの場合、最上位のセパレータ・ページがドキュメントの最初のページである必要があります。下位のセパレータ・ページを最初のページにすることはできませんが、2ページ目にすることはできる場合とできない場合があります。

ドキュメントを編成するために階層セパレータを使用したバッチ用のジョブを構成するには:

  1. 「処理」タブで、認識プロセッサ・ジョブを追加または編集します。

  2. 「ドキュメント編成」ページで「階層セパレータ・ページ」方法を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バー・コード定義」ページで、処理するドキュメントのバー・コード設定を構成します。セパレータ・ページや、ドキュメント・プロファイルまたはメタデータ値を提供するその他のバー・コードを含む、すべてのバー・コードを構成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトのドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(ドキュメント・プロファイルの追加または編集)を選択し、認識ジョブに適用するメタデータ・フィールドのグループを指定します。以前に作成したバー・コードまたはページ区切り定義を使用してドキュメント・プロファイルを動的に決定できます。

  6. 「ドキュメント処理」ページで、階層セパレータ・ジョブに固有の設定を完了します。

    1. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドでアクション(最初に見つかった値を使用、バー・コード値を上書き、バー・コード値をクリア)を指定します。

    2. 「ドキュメント階層セパレータ・ページ」表で、階層セパレータ・ページを構成します。

    3. ステップ5で定義したセパレータ・ページを使用してドキュメント・プロファイルを動的に決定することを選択した場合、ページ・セパレータ定義をドキュメント・プロファイルにマッピングするための「ドキュメント・プロファイル」列が「ドキュメント階層セパレータ・ページ」表に表示されます。

    4. 作成したドキュメントにソース・ドキュメントの添付を含める方法を指定します。

  7. 「フィールド」ページでメタデータ割当て設定を構成します。

  8. 「送信」をクリックし、認識ジョブの機能をテストします。

ドキュメントの編成を必要としないバッチ用のジョブの構成

バッチがすでにドキュメントに編成されている場合、ドキュメントの編成プロセスをスキップしてバー・コードの認識およびドキュメントの索引付けに進むことができます。

  • この方法で処理されたバッチはすでにドキュメントに分割されています。たとえば、バッチ内の各ドキュメントが電子メールの添付を表す、インポート・プロセッサで作成されるバッチにこのオプションを選択します。

  • 他の編成方法とは異なり、この方法で処理されたバッチにはイメージ・ドキュメントとイメージ以外のドキュメントが含まれることがあります。認識プロセッサがバー・コードやパッチ・コードを読み取るには、ドキュメントはイメージ形式である必要があるため、検出されたイメージ以外のドキュメントは影響を受けません。

ドキュメントの編成を必要としないバッチ用にジョブを構成するには:

  1. 「処理」タブで、認識プロセッサ・ジョブを追加または編集します。

  2. 「ドキュメント編成」ページで「なし: ドキュメント編成を実行しない」方法を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バー・コード定義」ページで、ドキュメントのバー・コード設定を構成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトのドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(ドキュメント・プロファイルの追加または編集)を選択し、認識ジョブに適用するメタデータ・フィールドのグループを指定します。選択したバー・コードを使用して、ドキュメント・プロファイルを動的に決定できます。

  6. 「ドキュメント処理」ページで、ドキュメント編成なしのジョブに固有の設定を完了します。

    1. オプションで、「構成」をクリックしてセパレータ・ページ定義を設定します。

      注:

      このタイプのジョブのセパレータを検出する目的は、セパレータをドキュメントから削除することです。

    2. 「バー・コードを読み取るドキュメントごとのページ数」フィールドに数値を指定します。すべてのドキュメント・ページでバー・コード認識を実行するには、0を指定します。

      この設定は、各ドキュメントの指定された最初からのページ数でバー・コード認識を実行することにより、パフォーマンスを最適化します。たとえば、バー・コードが10ページ中の3ページ目にある場合は、3を指定して、各ドキュメントの最初の3ページでバー・コードが認識されるようにします。また、このフィールドを使用して、それより後のドキュメント・ページの競合するバー・コードが無視されるようにすることもできます。

    3. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドでアクション(最初に見つかった値を使用、バー・コード値を上書き、バー・コード値をクリア)を指定します。

  7. 「フィールド」ページでメタデータ割当て設定を構成します。

  8. 「送信」をクリックし、認識ジョブの機能をテストします。