Benutzerdefiniertes generatives Modell V2.0 erstellen (Neu)

Der OCI Document Service verfügt über Key-Value Extraction powered by Large Multimodal Models (LMMs) und bietet eine verbesserte Genauigkeit und Anpassungsfähigkeit gegenüber herkömmlichen modellgesteuerten Methoden.

Info

Die Schlüssel/Wert-Extraktion des OCI Document-Service nutzt multimodale Argumentation, um sowohl Textinhalte als auch visuelle Layouts zu analysieren. Dadurch ist es äußerst effektiv, Dokumente mit verschiedenen Formaten, Vorlagen und Strukturen zu verarbeiten. Sie können ein Schema bereitstellen, in dem die erforderlichen Schlüssel (Felder) für die Extraktion beschrieben werden. So kann der Service sich ohne Umschulung des Modells über verschiedene Dokumenttypen hinweg anpassen.

Dieser große multimodale Modell (LMM) angetriebene Ansatz leuchtet in Situationen mit Layoutinkonsistenzen, unregelmäßiger Kennzeichnung oder knappen Trainingsdaten, Situationen, in denen traditionelle Vorlagen oder modellbasierte Lösungen häufig laufende Updates und Wartung erfordern.

Verfügbare Regionen

Sie können benutzerdefinierte Modelle für die generative Large Multimodal Model-(LMM-)basierte Key-Value-Extraktion in den folgenden OCI-Regionen erstellen:

Regionsname Standort Regions-ID Regionsschlüssel
Brazil East (Sao Paulo) São Paulo sa-saopaulo-1 GRU
Japan Central (Osaka) Ōsaka ap-osaka-1 KIX
UK South (London) London uk-london-1 LHR
US Midwest (Chicago) Chicago us-chicago-1 ORD

Lernen Sie Regionen und Availability-Domains kennen.

JSON-Datei für Schlüssel und Werte erstellen

Bei der generativen Extraktion geben Sie die zu extrahierenden Informationen an, indem Sie ein Schema definieren. Das Schema fungiert als eine Gruppe von Anweisungen, mit denen die relevanten Schlüssel (Felder) und ihre erwarteten Werte beschrieben werden. Basierend auf diesen Anweisungen identifiziert und extrahiert das Modell die Werte anhand Ihrer Angaben dokumentübergreifend.

  1. JSON-Schema definieren: Erstellen Sie eine JSON-Datei, die ein Array von Objekten enthält, wobei jedes Objekt einen zu extrahierenden Schlüssel darstellt.
  2. Schlüsseleigenschaften angeben: Erstellen Sie jedes Objekt im Array mit den folgenden Eigenschaften:
    • key: Der Name des zu extrahierenden Schlüssels (erforderlich).
    • dataType: Der erwartete Datentyp (optional).
    • description: Eine Beschreibung des Schlüssels in natürlicher Sprache (erforderlich).
  3. Schlüssel eingeben: Informationen zu Schlüsselnamen finden Sie unter Systemschlüssel und benutzerdefinierte Schlüssel verwenden.
  4. (Optional) Optionalen Datentyp hinzufügen: Wenn Sie einen bestimmten Datentyp für einen der Schlüssel benötigen, weisen Sie für die Eigenschaft dataType einen der folgenden Werte zu:
    • string
    • date
    • number
    • currency
    • phone
  5. Natürliche Sprache für Beschreibungen verwenden: Geben Sie in der Eigenschaft description klare, kontextbezogene Details in einfachem Englisch an, um das Modell der generativen KI bei der Identifizierung und Extraktion der richtigen Werte zu unterstützen.

    Mit diesem benutzerdefinierten Modell analysierte Dokumente können in verschiedenen Sprachen vorliegen, wie in der Spalte "Version 2" für die benutzerdefinierte Schlüssel/Wert-Extraktion in der Tabelle Unterstützte Sprachen aufgeführt.

    Eine wirksame Beschreibung verdeutlicht ausdrücklich:

    • Was stellt das Feld dar?

    • Wo sie normalerweise im Dokument angezeigt wird (visuelle oder kontextbezogene Position), z.B. in der oberen rechten Ecke.

    • Formatierung (Muster, Trennzeichen, Constraints), z.B. Datumsformate.

    • Auszuschließende Elemente, einschließlich visuell oder semantisch ähnlichem Text, den Sie nicht extrahieren möchten.

  6. JSON-Datei auffüllen: Fügen Sie die erforderlichen Schlüssel und deren Beschreibungen hinzu. Sie können das Feld description als leere Zeichenfolge belassen, wenn das Modell den Wert inferenzieren soll.
  7. Speichern Sie diese JSON-Datei in einer unterstützten Region in einem Objektspeicher-Bucket in Ihrem Mandanten.
Beispiel für eine JSON-Datei

Im Folgenden finden Sie eine JSON-Beispieldatei für die Schlüssel/Wert-Extraktion:

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]
Tipp

Weitere Beispiele zum Schreiben von Beschreibungen finden Sie unter Best Practices für benutzerdefinierte Beschreibungen.

Systemschlüssel und benutzerdefinierte Schlüssel verwenden

Document Understanding bietet eine Reihe vordefinierter Systemschlüssel. Diese Tasten sind auf die Arbeit mit verschiedenen Dokumenttypen und Layouts abgestimmt. Sie können diese Schlüssel unverändert wiederverwenden oder ihre Beschreibung ändern.

Mit vom System bereitgestellten Schlüsseln beginnen

Verwenden Sie zunächst die vordefinierten Systemschlüsseldefinitionen, und bewerten Sie deren Performance anhand eines repräsentativen Beispiels Ihrer Dokumente. Eine Liste der vom System bereitgestellten Schlüssel finden Sie unter Schlüssel-Wert-Extraktion.

  • Wenn die Ergebnisse den Anforderungen entsprechen, verwenden Sie die vom System bereitgestellten Schlüssel erneut.
  • Sie müssen keine Beschreibungen für diese Schlüssel hinzufügen.

Schlüsselbeschreibungen bei Bedarf anpassen

Wenn ein vom System bereitgestellter Schlüssel nicht den Anforderungen entspricht, definieren Sie eine benutzerdefinierte Beschreibung auf Basis der Dokumente.

Best Practices für benutzerdefinierte Beschreibungen

Im Folgenden finden Sie einige Best Practices mit Beispielen für das Schreiben von Schlüsselbeschreibungen:

Sei explizit und eindeutig

Unterscheiden Sie klar zwischen Feldern, die ähnlich aussehen könnten, wie z. B. verschiedenen numerischen Bezeichnern.

Beispiel

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label." 

Kontext- und Labelvarianten beschreiben

Generative Modelle sind stark auf umgebenden Text und Labels angewiesen. Verwenden Sie gängige Labelvarianten.

Beispiel

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Erwartete Werteformate angeben

Wenn das Feld einem bekannten Format entspricht, geben Sie es explizit an.

Beispiel

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Auszuschließende Angaben klären

Identifizieren Sie explizit ähnliche Felder, die Sie nicht extrahieren möchten.

Beispiel

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Synonyme und Labelvariationen einschließen

Stellen Sie verschiedene Labels bereit, um die Robustheit über Dokumentvarianten hinweg zu verbessern.

Beispiel

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Hinweise zum Referenzspeicherort hinzufügen

Wenn Dokumente konsistenten Layouts folgen, fügen Sie relative Positionshinweise hinzu.

Beispiel

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page." 

Beispiele angeben, die hilfreich sind

Konkrete Beispiele verbessern die Extraktionsgenauigkeit.

Beispiel

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Seien Sie prägnant und präzise

Bevorzugt einen klaren beschreibenden Satz ergänzt mit wesentlichen Einschränkungen oder Beispielen.

Fallback-Verhalten definieren

Geben Sie gegebenenfalls an, wie Werte inferenziert werden sollen, wenn das primäre Label fehlt.

Beispiel:

Wenn die Rechnungssumme fehlt, verwenden Sie stattdessen den fälligen Gesamtbetrag.

Abschnittsbewusstsein explizit codieren

Für Dokumente mit mehreren Abschnitten (z.B. Formulare) geben Sie den Abschnittskontext und die Feldreihenfolge an.

Beispiel

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Mehrwort- und Mehrzeilenwerte verarbeiten

Explizit Multi-Token oder mehrzeilige Extraktion zulassen, falls zutreffend.

Beispiel

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Verwenden Sie negative Richtlinien, um falsch positive Ergebnisse zu vermeiden

Geben Sie explizit an, wo Werte nicht extrahiert werden sollen.

Beispiel

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Felder ohne explizite Labels bearbeiten

Setzen Sie bei impliziten Feldern auf semantische Rollen- und Layouthinweise:

  • Position relativ zu Abschnittsüberschriften

  • Sortierung unter nahe gelegenen Feldern

  • Nähe zu zugehörigen Labels

Beispielsätze

  • Erscheint unmittelbar nach…
  • Direkt neben...
  • folgt der Abschnittsüberschrift…

Benutzerdefiniertes generatives Modell erstellen

So erstellen Sie ein benutzerdefiniertes Modell für die Schlüssel/Wert-Extraktion mit generativer KI:

Daten auswählen

Erstellen Sie mit Document Understanding ein benutzerdefiniertes generatives Schlüsselwertmodell (Key-Value, KV).

  1. Navigieren Sie zur Listenseite Projekte. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, finden Sie weitere Informationen unter Projekte auflisten.
  2. Führen Sie eine der folgenden Aktionen aus:
    • Wenn kein Projekt vorhanden ist, erstellen Sie ein Projekt, und wählen Sie das Projekt aus.
    • Wenn bereits ein Projekt vorhanden ist, wählen Sie das Projekt aus der Liste aus.
  3. Wählen Sie auf der Projektdetailseite die Option Modell erstellen aus. Informationen zum Suchen der Seite mit den Projektdetails finden Sie unter Projekt anzeigen.
  4. Wählen Sie Modell erstellen aus.
  5. Wählen Sie für Modelldetails Folgendes aus:
    • Modelltyp für Trainieren auswählen: Schlüsselwertextraktion
    • Modellversion: V2.0 (generative Extraktion)
  6. Wählen Sie unter Trainingsdaten die Option Vorhandenes Dataset auswählen aus.
  7. Wählen Sie unter Datenquelle die Option Object Storage aus.
  8. Wählen Sie den Bucket aus, der die JSON-Datei enthält, die Sie unter JSON-Datei für Schlüssel und Werte erstellen vorbereitet haben. Wenn sich der Bucket in einem anderen Compartment als dieses Projekt befindet, wählen Sie das Compartment mit dem Bucket aus.
  9. Wählen Sie unter Data Labeling-Datei die JSON-Datei aus, und wählen Sie Weiter aus.

Modell trainieren

  1. Geben Sie einen Namen für das benutzerdefinierte Modell an.
  2. (Optional) Geben Sie dem Modell eine Beschreibung, um es zu finden.
  3. Anzahl der Inferenzeinheiten ist eine Compute-Ressource, die für Ihren Endpunkt dediziert ist und auf 1 gesetzt ist. Sie können sie nicht ändern.
  4. Wählen Sie unter Training Document Language die Option EN für Englisch aus.
  5. Wählen Sie unter Schulungsdauer eine der folgenden Optionen aus:
    • Empfohlene Schulung: Document Understanding wählt automatisch die Schulungsdauer aus, um das beste Modell zu erstellen. Das Training kann bis zu 24 Stunden dauern.
    • Benutzerdefiniert: Mit dieser Option können Sie die maximale Schulungsdauer (in Stunden) festlegen.
  6. Wählen Sie Weiter.

Prüfen

  1. Prüfen Sie die Informationen, die Sie in den vorherigen Schritten angegeben haben. Sie können Änderungen vornehmen, indem Sie Zurück oder Bearbeiten auswählen.
  2. Wenn Sie mit der Auswahl zufrieden sind, wählen Sie Erstellen und trainieren aus.

Modell testen

  1. Nachdem das benutzerdefinierte Modell erstellt wurde, navigieren Sie auf der Seite mit den Modelldetails zum Abschnitt Analysieren.
  2. Laden Sie ein Dokument aus einer lokalen Datei oder aus Object Storage hoch, um das benutzerdefinierte Modell zu testen.
  3. Wählen Sie Analysieren aus.
  4. Auf dieser Seite prüfen Sie die Schlüssel und die extrahierten Werte.
  5. Wenn Sie mit den Ergebnissen nicht zufrieden sind, z.B. um einen Schlüssel hinzuzufügen oder eine Beschreibung zu aktualisieren, aktualisieren Sie Ihre JSON-Datei, und wiederholen Sie die vorherigen Schritte.