Automatisieren Sie Rechnungsbilder mit OCI Vision und OCI Generative AI

Einführung

Unternehmen erhalten oft Tausende von Rechnungen in unstrukturierten Formaten als gescannte Bilder oder PDFs von Lieferanten und Dienstleistern. Das manuelle Extrahieren von Daten aus diesen Ausgangsrechnungen, wie Rechnungsnummer, Kundenname, gekaufte Artikel und Gesamtbetrag, ist ein zeitaufwendiger und fehleranfälliger Prozess.

Diese Verzögerungen bei der Verarbeitung wirken sich nicht nur auf die Kreditorenzyklen und die Transparenz des Cashflows aus, sondern führen auch zu Engpässen bei Compliance, Auditing und Reporting.

Dieses Tutorial zeigt, wie Sie eine automatisierte Pipeline implementieren, die einen Bucket in Oracle Cloud Infrastructure (OCI) auf eingehende Rechnungsimages überwacht, Textinhalte mit OCI Vision extrahiert und dann OCI Generative AI (LLM) anwendet, um strukturierte Steuerdaten wie Rechnungsnummer, Kunde und Artikelliste zu extrahieren.

In diesem Tutorial werden folgende OCI-Services verwendet:

Service Zweck
OCI Vision Führt OCR für hochgeladene Rechnungsbilder aus.
OCI Generative AI Extrahiert strukturierte JSON-Daten aus OCR-Rohtext mit Wenig-Schuss-Prompts.
OCI Object Storage Speichert eingegebene Rechnungsbilder und gibt JSON-Ergebnisse aus.

Ziele

Voraussetzungen

Aufgabe 1: Python-Packages konfigurieren

  1. Führen Sie die Datei requirements.txt mit dem folgenden Befehl aus.

    pip install -r requirements.txt
    
  2. Führen Sie das Python-Skript aus (main.py).

  3. Laden Sie Rechnungsbilder (z.B. .png, .jpg) in den Eingabe-Bucket hoch.

  4. Warten Sie, bis das Image verarbeitet und die extrahierte JSON im Ausgabe-Bucket gespeichert wird.

Aufgabe 2: Code verstehen

3. Aufgabe: Code ausführen

Führen Sie den Code mit dem folgenden Befehl aus.

python main.py

Aufgabe 4: Testvorschläge

  1. Verwenden Sie echte oder Dummy-Rechnungen mit lesbaren Produktlinien und Kundennamen.

  2. Laden Sie mehrere Bilder im Eingabe-Bucket nacheinander hoch, um die automatisierte Verarbeitung anzuzeigen.

  3. Melden Sie sich bei der OCI-Konsole an, und navigieren Sie zu Object Storage, um die Ergebnisse in beiden Buckets zu prüfen.

Hinweis: In diesem Tutorial wird als Beispiel eine brasilianische Rechnung verwendet, um die Komplexität der Attribute und Disposition zu veranschaulichen und zu veranschaulichen, wie der Prompt zur Lösung dieses Falls erstellt wurde.

Rechnung

Aufgabe 5: Erwartete Ausgabe anzeigen

Sehen Sie sich für jedes hochgeladene Rechnungsbild die verarbeitete Ausgabe-Bucket-Datei an. Eine entsprechende .json-Datei wird mit strukturiertem Inhalt generiert, wie in der folgenden Abbildung dargestellt.

img.png

Hinweis:

Bestätigungen

Weitere Lernressourcen

Sehen Sie sich weitere Übungen zu docs.oracle.com/learn an, oder greifen Sie auf weitere kostenlose Lerninhalte im Oracle Learning YouTube-Kanal zu. Besuchen Sie außerdem education.oracle.com/learning-explorer, um ein Oracle Learning Explorer zu werden.

Die Produktdokumentation finden Sie im Oracle Help Center.