Dokumentklassifizierung und Schlüsselwertextraktion ausführen

Verwenden Sie vordefinierte OCI Document Understanding-Modelle, um Dokumentklassifizierung und Schlüsselwertextraktion in Ihren Anwendungen zu nutzen, ohne dass Fachkenntnisse zum maschinellen Lernen (ML) oder zu künstlicher Intelligenz (KI) erforderlich sind. Beispiel: Sie könnten die Dokumentklassifizierung verwenden, um Reisepässe, Führerscheine, Quittungen und Rechnungen zu identifizieren.

Wenn Sie weniger als 10.000 Dokumente haben, können Sie diese in einem einzigen Datenfluss verarbeiten. Wenn Sie mehr als 10.000 Dokumente haben, erstellen Sie einen separaten Datenfluss, um jeden Bucket zu verarbeiten (d.h. mit einem separaten Dataset für jeden Bucket), und verwenden Sie eine Sequenz, um die Datenflüsse nacheinander zu verarbeiten. Siehe Daten mit einer Sequenz aus Datenflüssen verarbeiten.
Voraussetzungen:
  1. Klicken Sie auf der Oracle Analytics-Homepage auf Erstellen, und klicken Sie dann auf Datenfluss.
  2. Wählen Sie das Dataset aus, das mit den zu analysierenden Dokumenten verknüpft ist, und klicken Sie dann auf Hinzufügen.

  3. Klicken Sie im Datenflusseditor auf Schritt hinzufügen (+).
  4. Doppelklicken Sie im Bereich Datenflussschritte auf KI-Modell anwenden , und wählen Sie das gewünschte Modell aus.
    Beispiel: Sie können das vortrainierte Modell für die Dokumentklassifizierung auswählen, um Reisepässe zu identifizieren.
  5. Gehen Sie unter "KI-Modell anwenden" zum Abschnitt "Eingaben", und konfigurieren Sie die Parameter Eingabespalte und Eingabetyp.
    • Wenn Sie Quelldokumente nach Bucket referenzieren, wählen Sie unter Eingabespalte die Option URL und unter Eingabetyp die Option Buckets aus.

    • Wenn Sie Quelldokumente individuell referenzieren, wählen Sie unter Eingabespalte die Option Dateispeicherort und unter Eingabetyp die Option Dokumente aus.
  6. Klicken Sie im Datenflusseditor auf Schritt hinzufügen (+), und wählen Sie Daten speichern aus.
  7. Geben Sie in Name einen Namen für das Ausgabe-Dataset ein.
    Beispiel: Sie können dem Dataset den Namen "Analyseergebnisse der Reisepassidentifizierung" geben.
  8. Geben Sie im Feld Daten speichern in den Speicherort für das Ausgabe-Dataset an.
  9. Klicken Sie auf Speichern, geben Sie einen Namen für den Datenfluss ein, und klicken Sie auf OK.
  10. Klicken Sie auf Datenfluss ausführen.
Wenn der Datenfluss die Analyse beendet, öffnen Sie das Dataset, das Sie in Schritt 7 angegeben haben.

Um das generierte Dataset zu finden, navigieren Sie von der Oracle Analytics-Homepage zu Daten und dann zu Datasets.
Beschreibung von GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png folgt
.png

Weitere Einzelheiten zu den generierten Ergebnissen finden Sie unter Generierte Ausgabedaten für OCI Document Understanding-Modelle.