機械翻訳について

ドキュメント編成に基づいたジョブの構成

様々な編成タイプの認識ジョブを構成する方法は次のとおりです:

固定数のページを含むドキュメント用のジョブの構成

このドキュメント編成方法では、バッチに固定ページ数を持つドキュメントが含まれます。 ジョブの「ドキュメント処理」ページで、ドキュメントごとのページ数と、バー・コードを読み取るドキュメント内のページ数を指定します。

この編成方法の例には次のものがあります。
  • 各ページにバー・コードが存在し、各ページが一意のドキュメントを表す1ページのドキュメント この例では、各ページにバー・コードが含まれる必要があるため、3ページ(バー・コードが見つからないか認識されない)には手動のデータ・エントリが必要です。

  • 2ページのドキュメント: 両面モードでスキャンされるページの表側および裏側など。 通常、ドキュメントの最初のページにバー・コードが含まれていますが、ページの裏側が最初に誤ってスキャンされた場合、2ページ目にバー・コードが含まれます。

  • フォーム・ドキュメント: 固定ページ数で構成されます。 たとえば、組織のビジネス上の契約は常に、5ページで構成されます。 ページ数が不明または添付ファイルがドキュメントでスキャンされている場合は、「セパレータ・ページ・メソッドの使用」が必要になることがあります。

固定ページ数を含むドキュメントの認識ジョブを構成するには:

  1. 「処理」タブの「認識プロセッサ・ジョブの追加または編集」

  2. 「ドキュメント編成」ページで「ドキュメントごとの固定ページ数」方法を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バーコード定義」ページの「バーコードの検出方法を構成」

  5. 「ドキュメント・プロファイル」ページで、「デフォルトドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(「ドキュメント・プロファイルの追加または編集」)を選択して、認識ジョブに適用するメタデータ・フィールドのグループを指定します。 選択したバー・コードを使用して「ドキュメント・プロファイルを動的に決定」を実行できます。

  6. 「ドキュメント処理」ページで、「ドキュメント編成」ページで編成が設定された「ドキュメントごとの固定ページ数」ジョブに固有の設定を完了します。

    1. 「ドキュメントごとのページ数」フィールドで、各ドキュメントに含む固定ページ数を入力します。

    2. 「バー・コードを読み取るドキュメントごとのページ数」フィールドに数を指定します。

      この設定は、各ドキュメントの最初の指定ページ数でバー・コード認識を実行することにより、パフォーマンスが最適化されます。 たとえば、バー・コードが10ページ中の3ページ目にある場合は、3を指定して、各ドキュメントの最初の3ページでバー・コードが認識されるようにします。 このフィールドを使用して、後でドキュメント・ページで競合するバー・コードが無視されていることを確認することもできます。

    3. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドのアクションを指定します。検索された最初の値を使用し、バー・コード値を上書きするか、バー・コード値をクリアします。

    4. 作成したドキュメントで「ソース・ドキュメント添付を含める方法」を指定します。

  7. フィールド・ページの「メタデータ割当設定の構成」

  8. 「送信」をクリックし、認識ジョブの機能をテストします。

各ページで同じバー・コード値を持つドキュメント用のジョブの構成

このドキュメント編成方法では、バッチはドキュメントの各ページに同じバー・コード値が含まれる複数のページ・ドキュメントで構成されます。 したがって、ページ間のバー・コード値の変化は、新しいドキュメントの開始を示します。 たとえば、顧客契約のドキュメントでは、各ページに1つの顧客IDバー・コードが含まれる場合があります。

ジョブの「ドキュメント処理」ページで、ジョブがドキュメントの区切りを決定するために使用するバー・コードとドキュメント当たりの最大ページ数を指定します。

各ページに同じバー・コード値を含むドキュメントのジョブを構成するには:

  1. 「処理」タブの「認識プロセッサ・ジョブの追加または編集」

  2. 「ドキュメント編成」ページで、「各ページに同じバー・コード値」編成を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バーコード定義」ページの「バーコードの検出方法を構成」 少なくとも、ドキュメントの分離を決定する「バーコード定義を作成」

  5. 「ドキュメント・プロファイル」ページで、「デフォルトドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(「ドキュメント・プロファイルの追加または編集」)を選択して、認識ジョブに適用するメタデータ・フィールドのグループを指定します。 選択したバー・コードを使用して「ドキュメント・プロファイルを動的に決定」を実行できます。

  6. 「ドキュメント処理」ページで、選択したドキュメント編成(各ページに同じバー・コード値)に固有の設定を完了します。

    1. 「ドキュメント区切りを決定するバー・コード」フィールドのステップ4で作成したバー・コード定義を選択します。

    2. 「ドキュメントごとの最大ページ数」フィールドに数を指定して、ドキュメントで許可されるページ数を制限します。 これはオプションのフィールドです。 ドキュメント当たりの最大ページ数の指定をスキップするには0 (ゼロ)を指定します。

    3. 「処理オプション」フィールドで、必要に応じて「オプティミスティック・バー・コード検出」機能を有効にします。 バー・コードが読み取れないか、ページに存在せず、この機能がアクティブな場合、認識プロセッサは前のページと次のページの値を比較し、それに応じて値を割り当てます。

      たとえば、3ページのバッチに、バー・コードAが指定された1ページ目、バー・コードがない2ページ目およびバー・コードAが指定された3ページ目があるとします。 オプティミスティック・バー・コード検出機能が有効な場合、認識プロセッサは3つのページすべてを同じドキュメントにグループ化します。 有効でない場合、1ページ目と3ページ目は1つのドキュメントにグループ化され、2ページ目は除外されます。

    4. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドのアクションを指定します。検索された最初の値を使用し、バー・コード値を上書きするか、バー・コード値をクリアします。

    5. 作成したドキュメントで「ソース・ドキュメント添付を含める方法」を指定します。

  7. フィールド・ページの「メタデータ割当設定の構成」

  8. 「送信」をクリックし、認識ジョブの機能をテストします。

ドキュメント間にセパレータ・ページがあるバッチ用のジョブの構成

「ドキュメント編成」方法として「セパレータ・ページ」が選択されている場合、バッチはドキュメント・セパレータ・ページで区切られた複数のページ・ドキュメントで構成されます。 (ドキュメント・セパレータの階層レベルのドキュメント組織については、「階層セパレータを使用したドキュメントのジョブの構成」で説明します) この編成タイプでは:

  • セパレータ・ページは、新しいドキュメントの開始を示します。 セパレータ・ページは、ドキュメントで保持することも、削除することもできます。

  • セパレータ・ページには、新しいドキュメントを示す、バー・コードおよび/またはパッチ・コードを含むことができます。

  • セパレータ・ページの検出方法を決定するルールを作成します。 たとえば、指定されたバー・コードまたはパッチ・コードが検出されるか、または両方が検出される必要がある場合に処理されるようにドキュメント分割を構成します。 「セパレータ・ページ定義の構成」を参照してください。

ドキュメント間にセパレータ・ページが含まれるバッチのジョブを構成するには:

  1. 「処理」タブの「認識プロセッサ・ジョブの追加または編集」

  2. 「ドキュメント編成」ページで「セパレータ・ページ」方法を選択します。 (この方法はデフォルトのドキュメント編成です。)

  3. 「バー・コード認識」ページで、バー・コード記号が認識されるように構成します。

  4. 「バーコード定義」ページで、処理する「ドキュメントのバーコード構成の構成」 セパレータ・ページ・バー・コードおよびドキュメント・プロファイルまたはメタデータ値を提供する他のバー・コードを含む、すべてのバー・コードを構成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(「ドキュメント・プロファイルの追加または編集」)を選択して、認識ジョブに適用するメタデータ・フィールドのグループを指定します。 選択したバー・コードを使用して「ドキュメント・プロファイルを動的に決定」を実行できます。

  6. 「ドキュメント処理」ページで、選択した「ドキュメント組織」 (「セパレータ・ページ」)に固有の設定を完了します。

    1. 「構成」および「セパレータ・ページの構成」をクリックします。

    2. 「ドキュメントごとの最大ページ数」フィールドに数を指定して、ドキュメントで許可されるページ数を制限します。 これはオプションのフィールドです。 ドキュメント当たりの最大ページ数の指定をスキップするには0 (ゼロ)を指定します。

      このフィールドは、セパレータ・ページの欠落および認識できなかったセパレータ・ページを検出する場合に役立ちます。 認識プロセッサがこの数に達すると、最後の有効なドキュメントと検出された次のセパレータ・シートの間にあるイメージが手動による索引付けのためにバッチ内に残ります。 たとえば、ジョブのバッチ内にあるドキュメントが25ページを超えないことがわかっている場合は、この数字を入力すると、ドキュメント・セパレータ・ページが検出されない場合または存在しない場合に、複数のドキュメントが結合されることはありません。

    3. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドのアクションを指定します。検索された最初の値を使用し、バー・コード値を上書きするか、バー・コード値をクリアします。

    4. 作成したドキュメントで「ソース・ドキュメント添付を含める方法」を指定します。

  7. 「送信」をクリックし、認識ジョブの機能をテストします。

階層セパレータのあるドキュメントにジョブを構成

認識プロセッサの階層セパレータ機能を使用すると、レベルの階層内でドキュメントを処理および編成できます。 たとえば、フォルダ・レベルおよびドキュメント・レベルを持つ2レベルの階層を使用して、次のフォルダ・レベル・セパレータ・ページが検出されるまで、ドキュメントは高レベルのフォルダ・メタデータ値を継承できます。

階層セパレータは特にバック・ファイル変換の構成に役立ち、フォルダおよびボックス内に格納される大量のドキュメントがデジタル化されます。 サード・パーティ・アプリケーションは、必要な階層セパレータ・ページを生成して、準備者がドキュメント、フォルダおよび/またはボックスのスタックをスキャンおよび認識処理用に準備するために挿入できます。

ノート:

  • ドキュメント・セパレータは検出されるが、メタデータ値は取得されない場合、すべてのメタデータ値が適用可能なレベル以下でクリアされ、間違ったメタデータ値が意図せずにドキュメントに適用されないようにします。

  • 階層セパレータ・ページの場合は、上部レベルのセパレータ・ページはドキュメントの最初のページである必要があります。一方、下部レベルのセパレータ・ページは1ページ目にすることはできませんが、2ページ目にできる場合とできない場合があります。

ドキュメントを編成するための階層セパレータが含まれるドキュメントのジョブを構成するには:

  1. 「処理」タブの「認識プロセッサ・ジョブの追加または編集」

  2. 「ドキュメント編成」ページで「階層セパレータ・ページ」方法を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バーコード定義」ページで、処理する「ドキュメントのバーコード構成の構成」 セパレータ・ページ・バー・コードおよびドキュメント・プロファイルまたはメタデータ値を提供する他のバー・コードを含む、すべてのバー・コードを構成します。

  5. 「ドキュメント・プロファイル」ページで、「デフォルトドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(「ドキュメント・プロファイルの追加または編集」)を選択して、認識ジョブに適用するメタデータ・フィールドのグループを指定します。 「ドキュメント・プロファイルを動的に決定」には、前に作成したバー・コードまたはページ分離定義を使用できます。

  6. 「ドキュメント処理」ページで、階層セパレータ・ジョブに固有の設定を完了します。

    1. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドのアクションを指定します。検索された最初の値を使用し、バー・コード値を上書きするか、バー・コード値をクリアします。

    2. 「ドキュメント階層セパレータ・ページ」表の「階層セパレータ・ページの構成」

    3. ステップ5で定義したセパレータ・ページを使用してドキュメント・プロファイルを動的に決定することを選択した場合は、ページ・セパレータ定義をドキュメント・プロファイルにマップするために、「ドキュメント・プロファイル」列が「ドキュメント階層セパレータ・ページ」表に表示されます。

    4. 作成したドキュメントで「ソース・ドキュメント添付を含める方法」を指定します。

  7. フィールド・ページの「メタデータ割当設定の構成」

  8. 「送信」をクリックし、認識ジョブの機能をテストします。

ドキュメントの編成を必要としないバッチ用のジョブの構成

バッチがすでにドキュメントに編成されている場合は、ドキュメント編成プロセスをスキップして、バー・コードの認識およびドキュメントの索引付けに進むことができます。

  • この方法で処理されるバッチは、すでにドキュメントに分割されています。 たとえば、バッチ内の各ドキュメントが電子メールの添付を表す、インポート・プロセッサで作成されるバッチにこのオプションを選択します。

  • 他の認識方法とは異なり、この方法で処理されるバッチには、イメージ・ドキュメントおよびイメージ以外のドキュメントが含まれる場合があります。 認識プロセッサがバー・コードやパッチ・コードを読み取るには、ドキュメントはイメージ形式である必要があるため、検出されたイメージ以外のドキュメントは影響を受けません。

ドキュメント編成を必要としないバッチのジョブを構成するには:

  1. 「処理」タブの「認識プロセッサ・ジョブの追加または編集」

  2. 「ドキュメント編成」ページで「なし: ドキュメント編成を実行しない」方法を選択します。

  3. 「バー・コード認識」ページで、バー・コードが認識されるように構成します。

  4. 「バーコード定義」ページの「ドキュメントのバーコード構成の構成」

  5. 「ドキュメント・プロファイル」ページで、「デフォルトドキュメント・プロファイル」フィールドで以前に作成したドキュメント・プロファイル(「ドキュメント・プロファイルの追加または編集」)を選択して、認識ジョブに適用するメタデータ・フィールドのグループを指定します。 選択したバー・コードを使用して「ドキュメント・プロファイルを動的に決定」を実行できます。

  6. 「ドキュメント処理」ページで、ドキュメント編成なしのジョブに固有の設定を完了します。

    1. オプションで、「構成」および「セパレータのページ定義の設定」をクリックします。

      ノート:

      このタイプのジョブのセパレータを検出する目的は、それをドキュメントから削除することです。

    2. 「バー・コードを読み取るドキュメントごとのページ数」フィールドに数を指定します。 すべてのドキュメント・ページでバー・コード認識を実行するには、0 (ゼロ)を指定します。

      この設定は、各ドキュメントの最初の指定ページ数でバー・コード認識を実行することにより、パフォーマンスが最適化されます。 たとえば、バー・コードが3/10ページ上にある場合、3と指定して各ドキュメントの最初の3ページでバー・コード認識が行われるようにします。 このフィールドを使用して、後でドキュメント・ページで競合するバー・コードが無視されていることを確認することもできます。

    3. 「ドキュメント内で1つのバー・コードに複数の値が見つかった場合」フィールドのアクションを指定します。検索された最初の値を使用し、バー・コード値を上書きするか、バー・コード値をクリアします。

  7. フィールド・ページの「メタデータ割当設定の構成」

  8. 「送信」をクリックし、認識ジョブの機能をテストします。