使用识别处理器,可以自动执行条形码识别、文档分隔以及对过程中的图像文档编制索引。
要了解有关识别处理以及如何配置和管理识别作业的信息,请参见:
识别处理器的设计旨在能够适应各种文档场景和配置。常见的识别处理场景为:
客户端用户扫描并释放包含文档的大量批处理后,识别作业将作为后处理步骤运行。
识别作业检测批处理中每页上的条形码和/或补丁程序代码。
根据作业的所选文档组织方法,识别处理器会将批处理的页分隔为各个文档。
识别作业通过将条形码值、默认值或值应用到文档元数据字段对文档编制索引。
作为识别处理的后处理步骤,批处理会被释放到提交处理器。
识别过程的主要基础概念包括:
为了组织文档,识别处理器要求批处理中包含单个图像格式的文档,即使单个文档实际上可能由多个文档组成。在批处理过程中,识别处理器会根据您选择的文档组织方法将批处理组织成逻辑文档。例如,您可以指定每个文档包含固定数量的页,或指定在文档之间包含分隔页。
对于文档已分隔开而只需要条形码识别的批处理,可以将识别作业配置为跳过文档组织。可以在识别作业的“文档组织”页上指定文档组织方法。可以选择以下方法之一:
每个文档的固定页数(为包含固定页数的文档配置作业)
各页上的相同条形码值(为每页具有相同条形码值的文档配置作业)
分隔页(为文档之间具有分隔页的批处理配置作业)
分层分隔页(使用分层分隔页为文档配置作业)
无:不执行文档组织(为不需要文档组织的批处理配置作业)
除文档组织方法外,使识别处理器能够执行自动条形码识别、文档分隔和索引编制的其他关键相关识别作业设置包括:
创建识别作业时,您可以指定识别处理器检测和识别条形码的方式:
在“条形码识别”页上,通用解码器默认处于选定状态。您可以指定要检测的条形码、特定于条形码的其他设置以及补丁程序代码检测。识别处理器会搜索所有页,以识别作业中设置为要检测的条形码。该页提供以下选项:
表 12-1 通用解码器选项
选项 | 说明 |
---|---|
1-D 符号 |
从 1-D 条形码符号列表中选择您希望识别处理器搜索的符号。 可供选择的 1-D 符号包括:
|
2-D 符号 |
选择您希望识别处理器搜索的 2-D 条形码符号。 可供选择的 2-D 符号包括:
|
每个图像的最大条形码数 |
指定每个图像的最大条形码数,值应介于 0 和 10 之间。解码器在检测到的条形码数等于或超过了此设置中指定的值时将停止处理图像。此设置可帮助优化系统性能。 默认情况下,此选项设置为 1。 |
最小条形码高度 |
指定图像上可能存在的最短条形码的高度,值应介于 0.2 英寸和 3 英寸之间。 默认情况下,此选项设置为 0.5 英寸。 此设置仅适用于一维条形码符号。 此设置可帮助识别对角条形码。 |
度量单位 |
从下拉列表中选择最小条形码高度设置和最大条形码宽度设置的度量单位。可用的选项包括英寸和厘米。数字精度为 3。 |
最大条形码宽度 |
指定图像上可能存在的最宽条形码的最大宽度,值应介于最小条形码高度和 10 英寸之间。 默认情况下,此选项设置为 2 英寸。 此设置仅适用于一维条形码符号。 此设置可帮助识别对角条形码。 |
最小条形码字符数 |
指定考虑处理的条形码的最少字符数,值应介于 1 和 1000 之间。 默认情况下,此选项设置为 1。 |
将条形码值解释为补丁程序代码 |
使用此设置可将条形码值映射到补丁程序代码类型。 如果识别了指定的条形码值,则可以指定将其解释为补丁程序代码类型,而不是条形码值。 在补丁程序代码下列出的各个补丁程序代码类型旁边的条形码值文本字段中,指定字母数字的条形码值:
仅将页中的第一个匹配项转换为补丁程序代码。条形码的剩余部分将不会转换为补丁程序代码,即使其值与在映射中指定的值匹配也是如此。 比较条形码值时区分大小写。 |
注:
如果您熟悉条形码符号,建议您选择此符号。条形码符号可提高性能,并降低检测到未知条形码而干扰处理的风险。
在“条形码定义”页上,指定一个或多个条形码定义,这些定义按字符长度等特征标识条形码。创建条形码定义时,可从以下验证规则中进行选择:
长度
掩码
正则表达式
选项列表(此页上的条形码必须匹配指定选项列表中包含的值)
无
当识别处理器识别条形码且这些条形码满足验证条件时,会将其分配给条形码定义。在作业中,这些条形码定义有多种使用方式,例如在分配元数据和分隔页时使用。有关管理条形码定义的信息,请参见添加或编辑条形码定义。
您可以使用一系列选项来定义文档分隔,包括条形码和/或补丁程序代码分隔页。
在“文档处理”页上指定的文档分隔选项取决于您选择的文档组织方法(请参见文档组织方法)。
如果指定包含固定页数的文档,则还必须指定每个文档的页数。当作业达到此数量时,将标识一个新文档并重新开始为批处理中的下一个文档计数。无需分隔页。
如果指定每一页上包含相同条形码值的文档,则必须指定用于分隔的条形码定义。当作业遇到具有不同条形码值的条形码定义时,将创建一个新文档。无需分隔页。
如果指定基于分隔页组织文档(单个分隔页或分层分隔页),则必须指定条形码和/或补丁程序代码分隔页规则。
如果指定不执行文档组织,则保留之前的所有文档分隔。在某些非典型配置中,可以选择使用分隔页。
您可以使用“文档处理”页上提供的选项,指定是否在创建的文档中包含源文档的附件以及如何包含。您可以从源文档附件字段中提供的以下选项中进行选择:
选择在已创建文档中包含所有附件(默认)选项可在已创建文档中包含源文档的所有附件。
选择包含具有匹配文档概要信息附件类型的附件选项可包含源文档中与文档概要信息中指定的附件类型匹配的所有附件。
如果您不希望在已创建文档中包含源文档附件,则选择不包含附件选项。
注:
在下列情况下,源文档附件字段在“文档处理”页上不可用:无: 不执行文档组织选项在“文档组织”页上处于选定状态。处理文档时,识别处理器会确定应使用哪些文档概要信息来标识可用于对文档编制索引的元数据字段。在“文档概要信息”页上,可以指定在识别作业处理文档时如何将文档概要信息分配给文档。请参见指定静态或动态确定的文档概要信息。您选择的文档组织方法对文档概要信息分配选项有影响。可以选择以下文档概要信息分配:
静态,方法是填写默认文档概要信息字段。
当选择不动态确定字段时或者找不到匹配的动态确定的文档概要信息时,识别作业将使用默认文档概要信息。
动态确定,根据条形码或分隔页值确定,取决于文档组织。
您可以应用“后处理”页上提供的设置来指定识别处理完成后发生的情况:
如果没有发生系统错误,则指定下一个批处理处理器,并指定应运行哪个作业(如果适用)。例如,您可能将提交处理器设置为下一步。还可以指定无表示无后处理动作。(如果选择无,则客户端必须处理该批处理。例如,客户端用户可以检查批处理的准确性,然后将其释放给提交处理器。)成功完成识别处理后,您还可以发送电子邮件通知并更改批处理名称、状态和优先级。
如果发生了一个或多个系统错误,则指定下一个批处理处理器,并指定应运行哪个作业(如果适用)。可以选择无,以便将批处理释放给客户端用户编制索引编制。还可以发送电子邮件通知并更改批处理名称、状态和优先级,以便在遇到识别处理系统错误时预警适当的人员。
以下是您在使用识别处理器作业时执行的常见任务。(有关配置特定类型识别作业的信息,请参见基于文档组织配置作业。)
所选过程的配置页会显示在右侧。
打开处理选项卡。
在识别处理器作业表中,单击 创建作业。可以选择某个作业并单击
对其进行编辑。
您也可以复制识别作业,方法是选择该识别作业,单击 并在出现提示时输入新名称。通过复制作业可以快速复制并修改作业。
在“一般设置”页上,输入作业的名称。
在“条形码识别”页上,指定特定于条形码识别的设置,并确定识别作业要检测的条形码类型(符号)。
条形码符号提高了性能,同时降低了检测到可能对处理造成干扰的未知条形码的风险。
在“条形码定义”页上,添加条形码定义。
有关背景信息,请参见用于检测和识别条形码及补丁程序代码的设置。有关步骤,请参见添加或编辑条形码定义。
在“文档组织”页上,指定文档在批处理中的构成方式。
请参见文档组织方法。
在“文档概要信息”页上,指定一个文档概要信息或配置一个动态确定的文档概要信息。显示的设置取决于所选的文档组织方法。您必须选择一个默认的文档概要信息。
有关背景信息,请参见用于对文档分类的设置。有关步骤,请参见指定静态或动态确定的文档概要信息。
在“文档处理”页上,指定应如何分隔和处理文档。可用设置取决于您选择的文档组织方法。如果应以单个或分层分隔页分隔文档,则配置条形码或补丁程序代码分隔页规则。
有关背景信息,请参见分隔文档的设置。有关步骤,请参见配置分隔页定义。
在此页上,还可以指定应如何包括附件(如果在“文档组织”页中选择了文档组织方法)。请参见处理附件的设置。
在“字段”页上,为每个文档设置条形码或其他值以自动填充元数据字段。
在“后处理”页上,指定识别处理完成后发生的操作。
检查“概要”页上的设置,然后单击提交。
测试识别处理器作业。
删除识别作业后,它将不再可用于将该作业设置为后处理步骤的批处理。删除识别作业前,您可能希望将其脱机以解决意外问题。当在客户端概要信息中或在处理器作业的“后处理”页上选择了识别作业时,这些作业就会运行。您可以临时停止作业运行(使其脱机)或更改已停用的作业使其重新运行。
要运行识别作业,必须将批处理配置为流向该作业进行处理。可以通过将识别处理器作业标识为客户端概要信息或其他处理器作业中的后处理步骤来实现此操作。
要配置来自客户端概要信息的批处理流,请参见配置客户端概要信息的后处理。
要配置来自导入处理器作业的批处理流,请参见配置导入处理器作业的后处理。
要配置来自到 PDF 或 TIFF 的转换作业的批处理流,请参见将批处理流配置为到 PDF 的转换作业和将批处理流配置为到 TIFF 的转换作业。
例如,您可以创建客户端概要信息以将文档扫描到批处理,然后再将其释放以进行识别处理。或者,您也可以创建一个导入处理器作业:该处理器作业首先导入电子邮件及其 PDF 附件,然后将其发送到转换处理器以将其转换为图像格式,最后发送文档以进行识别处理。
请记住,除非您计划跳过文档组织,否则识别处理器希望批处理中包含单个图像格式的文档,如文档组织方法中所述。