Automatiser les images de facture avec OCI Vision et OCI Generative AI

Présentation

Les entreprises reçoivent souvent des milliers de factures dans des formats non structurés sous forme d'images numérisées ou de PDF provenant de fournisseurs et de fournisseurs de services. L'extraction manuelle des données de ces factures, telles que le numéro de facture, le nom du client, les articles achetés et le montant total, est un processus chronophage et sujet aux erreurs.

Ces retards dans le traitement affectent non seulement les cycles des comptes fournisseurs et la visibilité des flux de trésorerie, mais introduisent également des goulots d'étranglement en matière de conformité, de vérification et de production de rapports.

Ce tutoriel explique comment mettre en oeuvre un pipeline automatisé qui surveille un seau dans Oracle Cloud Infrastructure (OCI) pour les images de facture entrantes, extrait du contenu textuel à l'aide du service Vision OCI, puis applique le service Intelligence artificielle générative pour OCI (LLM) pour extraire des données fiscales structurées telles que le numéro de facture, le client et la liste d'articles.

Les services OCI utilisés dans ce tutoriel sont les suivants :

Service Objet
Service de visualisation pour OCI Exécute le registre OCR sur les images de facture chargées.
Service d'intelligence artificielle générative pour OCI Extrait des données JSON structurées à partir du texte ROC brut à l'aide d'invites instantanées.
Service de stockage d'objets pour OCI Stocke les images de facture d'entrée et les résultats JSON de sortie.

Objectifs

Conditions requises

Tâche 1 : Configurer les ensembles Python

  1. Exécutez le fichier requirements.txt à l'aide de la commande suivante.

    pip install -r requirements.txt
    
  2. Exécutez le script Python (main.py).

  3. Chargez des images de facture (par exemple, .png, .jpg) dans votre seau d'entrée.

  4. Attendez que l'image soit traitée et que le fichier JSON extrait soit enregistré dans le seau de sortie.

Tâche 2 : Comprendre le code

Tâche 3 : Exécuter le code

Exécutez le code à l'aide de la commande suivante.

python main.py

Tâche 4 : Suggestions de test

  1. Utiliser des factures réelles ou fictives avec des gammes de produits lisibles et un nom de client.

  2. Chargez plusieurs images dans le seau d'entrée en séquence pour voir le traitement automatisé.

  3. Connectez-vous à la console OCI, naviguez jusqu'au service Stockage d'objets pour vérifier les résultats dans les deux seaux.

Note : Dans ce tutoriel, l'exemple utilisé est une facture brésilienne pour illustrer la complexité des attributs et de la disposition et la façon dont l'invite a été créée pour résoudre ce cas.

Facture

Tâche 5 : Voir la sortie attendue

Pour chaque image de facture chargée, consultez le fichier de seau de sortie traité. Un fichier .json correspondant est généré avec un contenu structuré, comme illustré dans l'image suivante.

img.png

Note :

Remerciements

Ressources d'apprentissage supplémentaires

Explorez d'autres laboratoires sur le site docs.oracle.com/learn ou accédez à plus de contenu d'apprentissage gratuit sur le canal Oracle Learning YouTube. De plus, visitez education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.

Pour obtenir la documentation sur le produit, visitez Oracle Help Center.