Überblick über Dokumentklassifizierung und Schlüsselwertextraktion

Der Document Understanding-Service in Oracle Cloud Infrastructure (OCI) stellt vortrainierte KI-Modelle bereit, die Text, Tabellen und andere wichtige Daten aus Dokumentdateien extrahieren können. Sie führen die Dokumentklassifizierung oder Schlüsselwertextraktion mit einem Dokument aus und verwenden dann diese extrahierten Daten bei Ihrer Analyse in Oracle Analytics.

Mit Document Understanding können Sie auch benutzerdefinierte Modelle für die Schlüsselwertextraktion und Dokumentklassifizierung erstellen.

In Oracle Analytics verwenden Sie Datenflüsse, um die KI-Modelle von Document Understanding auf Ihre Daten anzuwenden.

Oracle Analytics unterstützt mehrere vortrainierte und benutzerdefinierte KI-Modelle, die in Document Understanding verfügbar sind:
  • In Oracle Analytics unterstützte vortrainierte Modelle
    • Dokumentklassifizierung
    • Schlüsselwertextraktion (für Quittungen, Rechnungen, Führerscheine und Reisepässe)
  • In Oracle Analytics unterstützte benutzerdefinierte Modelle
    • Benutzerdefinierte Dokumentklassifizierung
    • Benutzerdefinierte Schlüsselwertextraktion

Sie müssen benutzerdefinierte Modelle in der OCI-Konsole einrichten und erstellen, bevor Sie sie in Oracle Analytics verwenden können. Zunächst verwenden Sie OCI Data Labeling, um ein angemessenes Dataset zu erstellen, mit dem Sie das Modell trainieren können. Anschließend erstellen Sie das benutzerdefinierte Modell. Siehe OCI Document Understanding - Benutzerdefinierte Modelle.

Beispielausgabe aus einem Dokumentklassifizierungsmodell

In diesem Beispiel wendet ein Datenfluss ein vortrainiertes Dokumentklassifizierungsmodell auf Dokumente im JPG-Format an, um vorherzusagen, ob es sich dabei um Quittungen handelt. Die Analyseergebnisse werden in ein Dataset ausgegeben. Das Dataset enthält den Wert RECEIPT für "Dokumenttyp" und eine Vorhersageebene für jedes Dokument unter "Konfidenz".


Beschreibung von GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png folgt
.png

Bevor Sie beginnen: