Automatiza las imágenes de facturas con OCI Vision y OCI Generative AI

Introducción

Las empresas a menudo reciben miles de facturas en formatos no estructurados como imágenes escaneadas o PDF procedentes de proveedores y proveedores de servicios. La extracción manual de datos de estas facturas, como el número de factura, el nombre del cliente, los artículos comprados y el importe total, es un proceso que requiere mucho tiempo y es propenso a errores.

Estos retrasos en el procesamiento no solo afectan los ciclos de cuentas a pagar y la visibilidad del flujo de caja, sino que también introducen cuellos de botella en el cumplimiento, la auditoría y la generación de informes.

En este tutorial se muestra cómo implantar un pipeline automatizado que supervise un cubo en Oracle Cloud Infrastructure (OCI) para las imágenes de facturas entrantes, extraiga contenido textual mediante OCI Vision y, a continuación, aplique OCI Generative AI (LLM) para extraer datos fiscales estructurados como el número de factura, el cliente y la lista de artículos.

Los servicios de OCI utilizados en este tutorial son:

Servicio Finalidad
OCI Vision Realiza OCR en imágenes de facturas de venta cargadas.
OCI Generative AI Extrae datos JSON estructurados del texto de OCR sin formato mediante peticiones de datos de pocos resultados.
OCI Object Storage Almacena imágenes de facturas de entrada y resultados de JSON de salida.

Objetivos

Requisitos

Tarea 1: Configuración de paquetes de Python

  1. Ejecute el archivo requirements.txt con el siguiente comando.

    pip install -r requirements.txt
    
  2. Ejecute el script de Python (main.py).

  3. Cargue imágenes de factura (por ejemplo, .png, .jpg) en el cubo de entrada.

  4. Espere a que se procese la imagen y se guarde el JSON extraído en el cubo de salida.

Tarea 2: Descripción del código

Tarea 3: Ejecutar el código

Ejecute el código con el siguiente comando.

python main.py

Tarea 4: Sugerencias de prueba

  1. Utilice facturas de venta reales o ficticias con líneas de productos legibles y nombre de cliente.

  2. Cargue varias imágenes en el bloque de entrada en secuencia para ver el procesamiento automatizado.

  3. Conéctese a la consola de OCI y vaya a Object Storage para verificar los resultados en ambos cubos.

Nota: En este tutorial, el ejemplo utilizado es una factura brasileña para ilustrar la complejidad de los atributos y la disposición y cómo se creó la petición de datos para resolver este caso.

Factura

Tarea 5: Ver salida esperada

Para cada imagen de factura cargada, consulte el archivo de cubo de salida procesado. Se genera un archivo .json correspondiente con contenido estructurado como se muestra en la siguiente imagen.

img.png

Nota:

Acuses de recibo

Más recursos de aprendizaje

Explore otros laboratorios en docs.oracle.com/learn o acceda a más contenido de aprendizaje gratuito en el canal YouTube de Oracle Learning. Además, visite education.oracle.com/learning-explorer para convertirse en un explorador de Oracle Learning.

Para obtener documentación sobre el producto, visite Oracle Help Center.