基于文档组织配置作业

您可以通过方式为不同的组织类型配置识别作业:

为包含固定页数的文档配置作业

使用此文档组织方法时,批处理包含固定页数的文档。在作业的“文档处理”页上,指定每个文档的页数和文档内要读取条形码的页数。

这种组织方法的示例包括:
  • 一页文档,其中的每页都存在条形码,并且每页都表示唯一的文档。在此示例中,因为每页都必须包含条形码,所以第 3 页(未找到或无法识别条形码)将需要手动输入数据。

  • 两页文档,例如在双面模式下扫描的页的正反面。尽管文档的第一页通常包括条形码,但如果意外先扫描了页的反面,则第二页将包括条形码。

  • 包含固定页数的表单文档。例如,组织的业务协议可能始终包含五页。如果页数未知或者附件与文档一起扫描,则可能需要使用分隔页方法

要为包含固定页数的文档配置识别作业,请执行以下操作:

  1. 处理选项卡上,添加或编辑识别处理器作业

  2. 在“文档组织”页上,选择每个文档的固定页数方法。

  3. 在“条形码识别”页上,配置要识别的条形码。

  4. 在“条形码定义”页上,配置条形码的检测方式

  5. 在“文档概要信息”页上,通过在默认文档概要信息字段中选择之前创建的文档概要信息(添加或编辑文档概要信息),指定要应用于识别作业的元数据字段组。您可以使用所选条形码动态确定文档概要信息

  6. 在“文档处理”页上,完成特定于每个文档的固定页数作业的设置,这些作业的组织在“文档组织”页上设置。

    1. 每个文档的页数字段中,输入每个文档包含的固定页数。

    2. 每个文档中要读取条形码的页数字段中,指定一个数字。

      此设置可在每个文档指定的前几页中执行条形码识别,从而优化性能。例如,如果条形码在第 3 页上(共 10 页),则可以指定 3 以在每个文档的前 3 页中执行条形码识别。您也可以使用此字段来确保后续文档页中的冲突条形码被忽略。

    3. 如果在文档中找到条形码的多个值字段中,指定一个操作:使用找到的第一个值、覆盖条形码值或清除条形码值。

    4. 指定在创建的文档中包括源文档附件的方式

  7. 在“字段”页上配置元数据分配设置

  8. 单击提交并测试识别作业的功能。

为每页具有相同条形码值的文档配置作业

使用此文档组织方法时,批处理包括多页文档,其中文档的每一页都包含相同的条形码值。因此,页之间的条形码值更改指示新文档的开始。例如,客户协议文档的各页可能都包含一个客户 ID 条形码。

在作业的“文档处理”页上,指定作业用于确定文档分隔的条形码和每个文档的最大页数。

要为每页具有相同条形码值的文档配置作业,请执行以下操作:

  1. 处理选项卡上,添加或编辑识别处理器作业

  2. 在“文档组织”页上,选择每一页上的相同条形码值组织。

  3. 在“条形码识别”页上,配置要识别的条形码。

  4. 在“条形码定义”页上,配置条形码的检测方式。至少创建条形码定义,该定义将确定文档分隔。

  5. 在“文档概要信息”页上,通过在默认文档概要信息字段中选择之前创建的文档概要信息(添加或编辑文档概要信息),指定要应用于识别作业的元数据字段组。您可以使用所选条形码动态确定文档概要信息

  6. 在“文档处理”页上,完成特定于所选文档组织(每一页上的相同条形码值)的设置。

    1. 确定文档分隔的条形码字段中,选择在步骤 4 中创建的条形码定义。

    2. 每个文档的最大页数字段中指定一个数字,以限制文档中允许的页数。此字段为可选字段。指定 0 可以跳过指定每个文档的最大页数。

    3. 处理选项字段中,可以选择启用乐观条形码检测功能。如果无法读取条形码或页上不存在条形码且此功能处于活动状态,则识别处理器会比较上一页和下一页的值,并相应地分配一个值。

      例如,三页批处理包含带有条形码 A 的页 1、不带条形码的页 2 以及带有条形码 A 的页 3。在启用了乐观条形码检测功能时,识别处理器会将所有 3 页分组到同一个文档中。在未启用时,页 1 和页 3 将分组到一个文档中,而排除页 2。

    4. 如果在文档中找到条形码的多个值字段中,指定一个操作:使用找到的第一个值、覆盖条形码值或清除条形码值。

    5. 指定在创建的文档中应如何包括源文档的附件

  7. 在“字段”页上配置元数据分配设置

  8. 单击提交并测试识别作业的功能。

为文档之间具有分隔页的批处理配置作业

选择分隔页作为文档组织方法后,批处理由多个以文档分隔页分隔的页面文档组成。(使用分层分隔页为文档配置作业中介绍了文档分隔页分层级别的文档组织。)对于这种组织类型:

  • 分隔页表示新文档的开始。可以在文档中保留或删除分隔页。

  • 分隔页可以包含条形码和/或补丁程序代码,以表示新文档。

  • 您可以创建控制分隔页检测方式的规则。例如,可以配置在检测到指定的条形码或补丁程序代码或要求同时检测到这两种代码时进行文档分隔。请参见配置分隔页定义

要为文档之间具有分隔页的批处理配置作业,请执行以下操作:

  1. 处理选项卡上,添加或编辑识别处理器作业

  2. 在“文档组织”页上,选择分隔页方法。(此方法为默认的文档组织方法。)

  3. 在“条形码识别”页上,配置要识别的条形码符号。

  4. 在“条形码定义”页上,配置文档的条形码设置以进行处理。配置所有条形码,包括分隔页条形码和可能提供文档概要信息或元数据值的任何其他条形码。

  5. 在“文档概要信息”页上,通过在默认文档概要信息字段中选择之前创建的文档概要信息(添加或编辑文档概要信息),指定要应用于识别作业的元数据字段组。您可以使用所选条形码动态确定文档概要信息

  6. 在“文档处理”页上,完成特定于所选文档组织分隔页)的设置。

    1. 单击配置配置分隔页

    2. 每个文档的最大页数字段中指定一个数字,以限制文档中允许的页数。此字段为可选字段。指定 0 可以跳过指定每个文档的最大页数。

      此字段有助于检测丢失的分隔页或无法识别的分隔页。如果识别处理器达到此数字,则最后一个有效文档和检测到的下一个分隔页之间的图像会保留在批处理中以进行手动索引。例如,如果您知道作业批处理中的文档不超过 25 页,请输入此数字以确保在检测不到文档分隔页或分隔页缺失时不会组合多个文档。

    3. 如果在文档中找到条形码的多个值字段中,指定一个操作:使用找到的第一个值、覆盖条形码值或清除条形码值。

    4. 指定在创建的文档中应如何包括源文档的附件

  7. 单击提交并测试识别作业的功能。

使用分层分隔页为文档配置作业

借助识别处理器的分层分隔页功能,您可以在层次级别内处理和组织文档。例如,您可能使用具有文件夹和文档级别的两级层次,其中文档继承更高级别的文件夹元数据值,直到检测到下一个文件夹级别分隔页为止。

分层分隔页在配置备份文件转换时非常有用,在此过程中,分层分隔页会将存储在文件夹和文件盒中的大量文档数字化。第三方应用程序可以生成所需的分层分隔页,准备人员可以插入这些分层分隔页以准备用于扫描和识别处理的文档、文件夹和/或文件盒的堆栈。

注:

  • 如果检测到文档分隔页但未获得元数据值,则会清除适用级别及以下级别的所有元数据值,以防无意中将错误的元数据值应用于文档。

  • 对于分层分隔页,顶层分隔页必须是文档的第一页,而低层分隔页不能是第一页,但是不是第二页都可以。

要为带有分层分隔页的批处理配置作业以组织文档,请执行以下操作:

  1. 处理选项卡上,添加或编辑识别处理器作业

  2. 在“文档组织”页上,选择分层分隔页方法。

  3. 在“条形码识别”页上,配置要识别的条形码。

  4. 在“条形码定义”页上,配置文档的条形码设置以进行处理。配置所有条形码,包括分隔页以及提供文档概要信息或元数据值的任何其他项。

  5. 在“文档概要信息”页上,通过在默认文档概要信息字段中选择之前创建的文档概要信息(添加或编辑文档概要信息),指定要应用于识别作业的元数据字段组。您可以使用之前创建的条形码或页分隔定义动态确定文档概要信息

  6. 在“文档处理”页上,完成特定于分层分隔页作业的设置。

    1. 如果在文档中找到条形码的多个值字段中,指定一个操作:使用找到的第一个值、覆盖条形码值或清除条形码值。

    2. 在“文档层次分隔页”表中配置分层分隔页

    3. 如果选择使用第 5 步中定义的分隔页动态确定文档概要信息,则“文档层次分隔页”表中将显示文档概要信息列,该列用于将分隔页定义与文档概要信息进行映射。

    4. 指定在创建的文档中应如何包括源文档的附件

  7. 在“字段”页上配置元数据分配设置

  8. 单击提交并测试识别作业的功能。

为不需要文档组织的批处理配置作业

如果已将批处理组织到文档中,可以跳过文档组织过程,继续识别条形码和索引文档。

  • 采用此方法处理的批处理已分隔为多个文档。例如,您可以对通过导入处理器创建的批处理选择此选项,其中批处理中的每个文档代表一个电子邮件附件。

  • 和其他组织方法不同,采用此方法处理的批处理可能包含图像文档和非图像文档。由于文档必须为图像格式,识别处理器才能读取其条形码或补丁程序代码,因此遇到的任何非图像文档都不会受到影响。

要为不需要文档组织的批处理配置作业,请执行以下操作:

  1. 处理选项卡上,添加或编辑识别处理器作业

  2. 在“文档组织”页上,选择无: 不执行文档组织方法。

  3. 在“条形码识别”页上,配置要识别的条形码。

  4. 在“条形码定义”页上,配置文档的条形码设置

  5. 在“文档概要信息”页上,通过在默认文档概要信息字段中选择之前创建的文档概要信息(添加或编辑文档概要信息),指定要应用于识别作业的元数据字段组。您可以使用所选条形码动态确定文档概要信息

  6. 在“文档处理”页上,完成特定于无文档组织作业的设置。

    1. (可选)单击配置,然后设置分隔页定义

      注:

      为此类作业检测分隔页的目的是将其从文档中删除。

    2. 每个文档中要读取条形码的页数字段中,指定一个数字。指定 0 会在所有文档页上执行条形码识别。

      此设置可在每个文档指定的前几页中执行条形码识别,从而优化性能。例如,如果条形码在第 3 页上(共 10 页),则可以指定 3 以在每个文档的前 3 页中执行条形码识别。您也可以使用此字段来确保后续文档页中的冲突条形码被忽略。

    3. 如果在文档中找到条形码的多个值字段中,指定一个操作:使用找到的第一个值、覆盖条形码值或清除条形码值。

  7. 在“字段”页上配置元数据分配设置

  8. 单击提交并测试识别作业的功能。