使用 OCI Vision 和 OCI Generative AI 实现发票图像自动化

简介

公司通常会收到数千张非结构化格式的发票,这些发票是来自供应商和服务提供商的扫描图像或 PDF。从这些发票中手动提取数据(例如发票编号、客户名称、采购的货品和总金额)是一个耗时且容易出错的过程。

这些处理延迟不仅会影响应付账款周期和现金流可见性,还会导致合规性、审计和报告方面的瓶颈。

此教程演示了如何实施自动化管道来监视 Oracle Cloud Infrastructure (OCI) 中存储桶的传入发票图像,使用 OCI Vision 提取文本内容,然后应用 OCI Generative AI (LLM) 提取结构化财务数据,例如发票编号、客户和货品列表。

本教程中使用的 OCI 服务包括:

服务 用途
OCI 视觉服务 对上载的发票图像执行 OCR。
OCI 生成式 AI 使用少量提示从原始 OCR 文本中提取结构化 JSON 数据。
OCI 对象存储 存储输入发票图像和输出 JSON 结果。

目标

Prerequisites

任务 1:配置 Python 程序包

  1. 使用以下命令运行 requirements.txt 文件。

    pip install -r requirements.txt
    
  2. 运行 Python 脚本 (main.py)。

  3. 将发票图像(例如 .png.jpg)上载到输入存储桶。

  4. 等待处理映像并将提取的 JSON 保存到输出存储桶中。

任务 2:了解代码

任务 3:运行代码

使用以下命令运行代码。

python main.py

任务 4:测试建议

  1. 使用具有可读产品系列和客户名称的真实或虚拟发票。

  2. 按顺序在输入桶中上载多个图像以查看自动处理。

  3. 登录 OCI 控制台,导航到对象存储以验证两个存储桶中的结果。

注:在本教程中,使用的示例是巴西发票,用于说明属性和处置的复杂性以及如何创建提示来解决此情况。

发票

任务 5:查看预期输出

对于每个上载的发票图像,请查看处理的输出存储桶文件。使用结构化内容生成相应的 .json 文件,如下图中所示。

img.png

注:

确认

更多学习资源

通过 docs.oracle.com/learn 浏览其他实验室,或者通过 Oracle Learning YouTube 频道访问更多免费学习内容。此外,请访问 education.oracle.com/learning-explorer 以成为 Oracle Learning Explorer。

有关产品文档,请访问 Oracle 帮助中心