Benutzerdefiniertes generatives Modell V2.0 erstellen (Neu)
Der OCI Document Service verfügt über Key-Value Extraction powered by Large Multimodal Models (LMMs) und bietet eine verbesserte Genauigkeit und Anpassungsfähigkeit gegenüber herkömmlichen modellgesteuerten Methoden.
Info
Die Schlüssel/Wert-Extraktion des OCI Document-Service nutzt multimodale Argumentation, um sowohl Textinhalte als auch visuelle Layouts zu analysieren. Dadurch ist es äußerst effektiv, Dokumente mit verschiedenen Formaten, Vorlagen und Strukturen zu verarbeiten. Sie können ein Schema bereitstellen, in dem die erforderlichen Schlüssel (Felder) für die Extraktion beschrieben werden. So kann der Service sich ohne Umschulung des Modells über verschiedene Dokumenttypen hinweg anpassen.
Dieser große multimodale Modell (LMM) angetriebene Ansatz leuchtet in Situationen mit Layoutinkonsistenzen, unregelmäßiger Kennzeichnung oder knappen Trainingsdaten, Situationen, in denen traditionelle Vorlagen oder modellbasierte Lösungen häufig laufende Updates und Wartung erfordern.
Verfügbare Regionen
Sie können benutzerdefinierte Modelle für die generative Large Multimodal Model-(LMM-)basierte Key-Value-Extraktion in den folgenden OCI-Regionen erstellen:
| Regionsname | Standort | Regions-ID | Regionsschlüssel |
|---|---|---|---|
| Brazil East (Sao Paulo) | São Paulo |
sa-saopaulo-1
|
GRU
|
| Japan Central (Osaka) | Ōsaka |
ap-osaka-1
|
KIX
|
| UK South (London) | London |
uk-london-1
|
LHR
|
| US Midwest (Chicago) | Chicago |
us-chicago-1
|
ORD
|
Lernen Sie Regionen und Availability-Domains kennen.
Berechtigungen hinzufügen
Berechtigungen mit IAM-Policys hinzufügen:
JSON-Datei für Schlüssel und Werte erstellen
Bei der generativen Extraktion geben Sie die zu extrahierenden Informationen an, indem Sie ein Schema definieren. Das Schema fungiert als eine Gruppe von Anweisungen, mit denen die relevanten Schlüssel (Felder) und ihre erwarteten Werte beschrieben werden. Basierend auf diesen Anweisungen identifiziert und extrahiert das Modell die Werte anhand Ihrer Angaben dokumentübergreifend.
Im Folgenden finden Sie eine JSON-Beispieldatei für die Schlüssel/Wert-Extraktion:
[
{
"key": "InvoiceId",
"dataType": "String",
"description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #,
Bill Number and appears near the top of the invoice, often right after the text label."
},
{
"key": "InvoiceDate",
"description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
},
{
"key": "DueDate",
"description": ""
},
{
"key": "PurchaseOrder",
"description": ""
},
{
"key": "InvoiceTotal",
"description": "Total amount due. Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
},
{
"key": "TotalTax",
"description": ""
},
{
"key": "SubTotal",
"description": ""
},
{
"key": "AmountDue",
"description": ""
},
{
"key": "PreviousUnpaidBalance",
"description": ""
}
]Weitere Beispiele zum Schreiben von Beschreibungen finden Sie unter Best Practices für benutzerdefinierte Beschreibungen.
Systemschlüssel und benutzerdefinierte Schlüssel verwenden
Document Understanding bietet eine Reihe vordefinierter Systemschlüssel. Diese Tasten sind auf die Arbeit mit verschiedenen Dokumenttypen und Layouts abgestimmt. Sie können diese Schlüssel unverändert wiederverwenden oder ihre Beschreibung ändern.
Mit vom System bereitgestellten Schlüsseln beginnen
Verwenden Sie zunächst die vordefinierten Systemschlüsseldefinitionen, und bewerten Sie deren Performance anhand eines repräsentativen Beispiels Ihrer Dokumente. Eine Liste der vom System bereitgestellten Schlüssel finden Sie unter Schlüssel-Wert-Extraktion.
- Wenn die Ergebnisse den Anforderungen entsprechen, verwenden Sie die vom System bereitgestellten Schlüssel erneut.
- Sie müssen keine Beschreibungen für diese Schlüssel hinzufügen.
Schlüsselbeschreibungen bei Bedarf anpassen
Wenn ein vom System bereitgestellter Schlüssel nicht den Anforderungen entspricht, definieren Sie eine benutzerdefinierte Beschreibung auf Basis der Dokumente.
-
Passen Sie Beschreibungen an dokumentenspezifische Terminologie, Layouts und Formatierungsmuster an.
-
Befolgen Sie die Beschreibungen unter Best Practices für benutzerdefinierte Beschreibungen.
Best Practices für benutzerdefinierte Beschreibungen
Im Folgenden finden Sie einige Best Practices mit Beispielen für das Schreiben von Schlüsselbeschreibungen:
Sei explizit und eindeutig
Unterscheiden Sie klar zwischen Feldern, die ähnlich aussehen könnten, wie z. B. verschiedenen numerischen Bezeichnern.
Beispiel
"key": "Invoice number"
"description": "A unique alphanumeric identifier assigned to the invoice.
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice,
often right after the text label." Kontext- und Labelvarianten beschreiben
Generative Modelle sind stark auf umgebenden Text und Labels angewiesen. Verwenden Sie gängige Labelvarianten.
Beispiel
"key": "Company GST Number" "description": "Company GST number,
often labeled as GSTIN, GST No., or Tax ID. Usually appears
in the header with other business identifiers."Erwartete Werteformate angeben
Wenn das Feld einem bekannten Format entspricht, geben Sie es explizit an.
Beispiel
"key": "Invoice Date" "description": "Date the invoice was issued.
Common formats include DD-MM-YYYY or MM/DD/YYYY."Auszuschließende Angaben klären
Identifizieren Sie explizit ähnliche Felder, die Sie nicht extrahieren möchten.
Beispiel
"key": "Total Amount" "description": "Total amount due.
Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."Synonyme und Labelvariationen einschließen
Stellen Sie verschiedene Labels bereit, um die Robustheit über Dokumentvarianten hinweg zu verbessern.
Beispiel
"key": "Customer Phone Number" "description": "Customer phone number.
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the
customer name or address."Hinweise zum Referenzspeicherort hinzufügen
Wenn Dokumente konsistenten Layouts folgen, fügen Sie relative Positionshinweise hinzu.
Beispiel
"key": "Supplier Address" "description": "Supplier address
located under the business name in the top-left area of the first page." Beispiele angeben, die hilfreich sind
Konkrete Beispiele verbessern die Extraktionsgenauigkeit.
Beispiel
"key": "Invoice Date" "description": "Invoice date,
for example 24-12-2025 or Dec 24, 2025.
Usually follows labels such as Date or Invoice Date."Seien Sie prägnant und präzise
Bevorzugt einen klaren beschreibenden Satz ergänzt mit wesentlichen Einschränkungen oder Beispielen.
Fallback-Verhalten definieren
Geben Sie gegebenenfalls an, wie Werte inferenziert werden sollen, wenn das primäre Label fehlt.
Beispiel:
Wenn die Rechnungssumme fehlt, verwenden Sie stattdessen den fälligen Gesamtbetrag.
Abschnittsbewusstsein explizit codieren
Für Dokumente mit mehreren Abschnitten (z.B. Formulare) geben Sie den Abschnittskontext und die Feldreihenfolge an.
Beispiel
"key": "First Name" "description": "Person’s given name.
Appears under the Personal Information or Applicant Details section header.
Usually the first field in the section and appears before Last Name.
Might contain multiple words (for example, MaryAnn)."Mehrwort- und Mehrzeilenwerte verarbeiten
Explizit Multi-Token oder mehrzeilige Extraktion zulassen, falls zutreffend.
Beispiel
"key": "Address" "description": "Full residential address.
May span multiple consecutive lines within the same section.
Extract all adjacent address lines as a single value."Verwenden Sie negative Richtlinien, um falsch positive Ergebnisse zu vermeiden
Geben Sie explizit an, wo Werte nicht extrahiert werden sollen.
Beispiel
"key": "Applicant Name" "description": "Applicant name.
Do not extract names appearing in signature blocks, declaration sections,
or references to officials or witnesses."Felder ohne explizite Labels bearbeiten
Setzen Sie bei impliziten Feldern auf semantische Rollen- und Layouthinweise:
-
Position relativ zu Abschnittsüberschriften
-
Sortierung unter nahe gelegenen Feldern
-
Nähe zu zugehörigen Labels
Beispielsätze
- Erscheint unmittelbar nach…
- Direkt neben...
- folgt der Abschnittsüberschrift…
Benutzerdefiniertes generatives Modell erstellen
So erstellen Sie ein benutzerdefiniertes Modell für die Schlüssel/Wert-Extraktion mit generativer KI:
Daten auswählen
Erstellen Sie mit Document Understanding ein benutzerdefiniertes generatives Schlüsselwertmodell (Key-Value, KV).
Modell trainieren
Prüfen
- Prüfen Sie die Informationen, die Sie in den vorherigen Schritten angegeben haben. Sie können Änderungen vornehmen, indem Sie Zurück oder Bearbeiten auswählen.
- Wenn Sie mit der Auswahl zufrieden sind, wählen Sie Erstellen und trainieren aus.
Modell testen
- Nachdem das benutzerdefinierte Modell erstellt wurde, navigieren Sie auf der Seite mit den Modelldetails zum Abschnitt Analysieren.
- Laden Sie ein Dokument aus einer lokalen Datei oder aus Object Storage hoch, um das benutzerdefinierte Modell zu testen.
- Wählen Sie Analysieren aus.
- Auf dieser Seite prüfen Sie die Schlüssel und die extrahierten Werte.
- Wenn Sie mit den Ergebnissen nicht zufrieden sind, z.B. um einen Schlüssel hinzuzufügen oder eine Beschreibung zu aktualisieren, aktualisieren Sie Ihre JSON-Datei, und wiederholen Sie die vorherigen Schritte.