Automatizza le immagini delle fatture con OCI Vision e OCI Generative AI

Introduzione

Le aziende ricevono spesso migliaia di fatture in formati non strutturati come immagini scansionate o PDF provenienti da fornitori e fornitori di servizi. L'estrazione manuale dei dati da queste fatture, ad esempio il numero di fattura, il nome del cliente, gli articoli acquistati e l'importo totale, è un processo dispendioso in termini di tempo e soggetto a errori.

Questi ritardi nell'elaborazione non solo influiscono sui cicli di contabilità fornitori e sulla visibilità dei flussi di cassa, ma introducono anche colli di bottiglia in termini di conformità, audit e reporting.

Questa esercitazione descrive come implementare una pipeline automatizzata che monitora un bucket in Oracle Cloud Infrastructure (OCI) per le immagini delle fatture in entrata, estrae il contenuto testuale utilizzando OCI Vision e quindi applica OCI Generative AI (LLM) per estrarre dati fiscali strutturati come numero di fattura, cliente e elenco di articoli.

I servizi OCI utilizzati in questa esercitazione sono:

Servizio Scopo
OCI Vision Esegue OCR sulle immagini delle fatture caricate.
AI generativa OCI Estrae i dati JSON strutturati dal testo OCR raw utilizzando prompt con poche immagini.
Memorizzazione degli oggetti OCI Memorizza le immagini delle fatture di input e i risultati JSON di output.

Obiettivi

Prerequisiti

Task 1: Configurare i pacchetti Python

  1. Eseguire il file requirements.txt utilizzando il comando seguente.

    pip install -r requirements.txt
    
  2. Eseguire lo script Python (main.py).

  3. Caricare le immagini delle fatture (ad esempio, .png, .jpg) nel bucket di input.

  4. Attendere che l'immagine venga elaborata e che il file JSON estratto venga salvato nel bucket di output.

Task 2: Comprendere il codice

Task 3: Esecuzione del codice

Eseguire il codice utilizzando il comando seguente.

python main.py

Task 4: Suggerimenti test

  1. Utilizza fatture reali o fittizie con linee di prodotti leggibili e nome cliente.

  2. Caricare più immagini nel bucket di input in sequenza per visualizzare l'elaborazione automatica.

  3. Eseguire il login a OCI Console, andare a Storage degli oggetti per verificare i risultati in entrambi i bucket.

Nota: in questa esercitazione, il campione utilizzato è una fattura brasiliana per illustrare la complessità degli attributi e della disposizione e la modalità di creazione del prompt per risolvere questo caso.

Fattura

Task 5: Visualizza output previsto

Per ogni immagine della fattura caricata, esaminare il file del bucket di output elaborato. Viene generato un file .json corrispondente con contenuto strutturato come mostrato nell'immagine seguente.

img.png

Nota:

Conferme

Altre risorse di apprendimento

Esplora altri laboratori su docs.oracle.com/learn o accedi a più contenuti di formazione gratuiti sul canale YouTube di Oracle Learning. Inoltre, visitare education.oracle.com/learning-explorer per diventare Oracle Learning Explorer.

Per la documentazione del prodotto, visitare Oracle Help Center.