Automatize imagens de faturas com OCI Vision e OCI Generative AI

Introdução

Muitas vezes, as empresas recebem milhares de faturas em formatos não estruturados como imagens digitalizadas ou PDFs provenientes de fornecedores e prestadores de serviços. A extração manual de dados dessas faturas, como número da fatura, nome do cliente, itens comprados e valor total, é um processo demorado e propenso a erros.

Esses atrasos no processamento não afetam apenas os ciclos de contas a pagar e a visibilidade do fluxo de caixa, mas também introduzem gargalos na conformidade, na auditoria e nos relatórios.

Este tutorial demonstra como implementar um pipeline automatizado que monitora um bucket na Oracle Cloud Infrastructure (OCI) para imagens de NFFs recebidas, extrai conteúdo textual usando o OCI Vision e, em seguida, aplica o OCI Generative AI (LLM) para extrair dados fiscais estruturados, como número da NFF, cliente e lista de itens.

Os serviços do OCI usados neste tutorial são:

Serviço Objetivo
OCI Vision Executa OCR em imagens de NFF carregadas.
IA Generativa do OCI Extrai dados JSON estruturados de texto OCR bruto usando prompts de poucas capturas.
OCI Object Storage Armazena imagens de NFF de entrada e resultados JSON de saída.

Objetivos

Pré-requisitos

Tarefa 1: Configurar Pacotes Python

  1. Execute o arquivo requirements.txt usando o comando a seguir.

    pip install -r requirements.txt
    
  2. Execute o script Python (main.py).

  3. Faça upload de imagens de NFF (por exemplo, .png, .jpg) para seu bucket de entrada.

  4. Aguarde o processamento da imagem e o JSON extraído salvo no bucket de saída.

Tarefa 2: Compreender o Código

Tarefa 3: Executar o Código

Execute o código usando o comando a seguir.

python main.py

Tarefa 4: Sugestões de Teste

  1. Use NFFs reais ou fictícias com linhas de produtos legíveis e nome do cliente.

  2. Faça upload de várias imagens no bloco de entrada em sequência para ver o processamento automatizado.

  3. Faça log-in na Console do OCI e navegue até o serviço Object Storage para verificar os resultados em ambos os buckets.

Observação: neste tutorial, a amostra usada é uma NFF brasileira para ilustrar a complexidade dos atributos e da disposição e como o prompt foi criado para resolver esse caso.

Fatura

Tarefa 5: Exibir Saída Esperada

Para cada imagem de fatura carregada, verifique o arquivo de bucket de saída processado. Um arquivo .json correspondente é gerado com conteúdo estruturado, conforme mostrado na imagem a seguir.

img.png

Observação:

Confirmações

Mais Recursos de Aprendizado

Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal do Oracle Learning YouTube. Além disso, acesse education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.

Para obter a documentação do produto, visite o Oracle Help Center.