文档分类和键值提取概览

在 Oracle Cloud Infrastructure (OCI) 中,文档理解服务提供了预训练的 AI 模型,这些模型可以从文档文件中提取文本、表以及其他关键数据。您可以对文档执行文档分类或键值提取,然后在 Oracle Analytics 中进行分析时使用提取的数据。

使用文档理解服务,您还可以创建用于键值提取和文档分类的定制模型。

在 Oracle Analytics 中,您可以使用数据流将文档理解 AI 模型应用于您的数据。

Oracle Analytics 支持文档理解服务中可用的多个预训练和定制 AI 模型:
  • Oracle Analytics 中支持的预训练模型
    • 文档分类
    • 键值提取(适用于收据、发票、驾照和护照)
  • Oracle Analytics 中支持的定制模型
    • 定制文档分类
    • 定制键值提取

必须先在 OCI 控制台中设置和构建定制模型,才能在 Oracle Analytics 中使用它们。首先,使用 OCI 数据标签服务创建可用于训练模型的适当数据集,然后构建定制模型。请参见OCI 文档理解服务 — 定制模型

文档分类模型的输出示例

在此示例中,数据流将预训练的文档分类模型应用于 JPG 格式的文档以预测它们是否为收据,并将分析结果输出到数据集。该数据集中 "Document Type" 列的值为 RECEIPT,"Confidence" 列的值为每个文档的置信度预测级别。


GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png 的说明如下
.png 的说明

准备工作: