Creazione di un modello generativo personalizzato V2.0 (nuovo)
OCI Document Service offre l'estrazione di valore chiave basata su LMM (Large Multimodal Models), che offre maggiore precisione e adattabilità rispetto ai metodi convenzionali basati su modelli.
Informazioni
L'estrazione del valore chiave del servizio OCI Document utilizza un ragionamento multimodale per analizzare sia i contenuti testuali che i layout visivi, rendendolo altamente efficace per la gestione di documenti con formati, modelli e strutture diversi. È possibile fornire uno schema che descriva le chiavi (campi) necessarie per l'estrazione, consentendo al servizio di adattarsi a diversi tipi di documento senza la necessità di riqualificare il modello.
Questo ampio approccio basato su modelli multimodali (LMM) risplende in situazioni che implicano incoerenze di layout, etichettatura irregolare o dati di formazione scarsi, circostanze in cui i modelli tradizionali o le soluzioni basate su modelli richiedono spesso aggiornamenti e manutenzione continui.
Regioni disponibili
Puoi creare modelli personalizzati per l'estrazione del valore chiave basato su modello multimodale generativo di grandi dimensioni (LMM) nelle seguenti aree OCI:
| Nome dell'area | Posizione | Identificativo dell'area | Chiave area |
|---|---|---|---|
| Brasile (Est) - San Paolo | San Paolo |
sa-saopaulo-1
|
GRU
|
| Giappone centrale (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Regno Unito (Sud) - Londra | Londra |
uk-london-1
|
LHR
|
| Stati Uniti (Midwest) - Chicago | Chicago |
us-chicago-1
|
ORD
|
Informazioni su Aree e domini di disponibile.
Aggiunta di autorizzazioni
Aggiungere le autorizzazioni utilizzando i criteri IAM:
Creazione di un file JSON per chiavi e valori
Con l'estrazione generativa, è possibile specificare le informazioni da estrarre definendo uno schema. Lo schema funge da set di istruzioni che descrivono le chiavi (campi) di interesse e i relativi valori previsti. In base a queste istruzioni, il modello identifica ed estrae i valori tra i documenti con le specifiche.
Ecco un esempio di file JSON per l'estrazione key-value:
[
{
"key": "InvoiceId",
"dataType": "String",
"description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #,
Bill Number and appears near the top of the invoice, often right after the text label."
},
{
"key": "InvoiceDate",
"description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
},
{
"key": "DueDate",
"description": ""
},
{
"key": "PurchaseOrder",
"description": ""
},
{
"key": "InvoiceTotal",
"description": "Total amount due. Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
},
{
"key": "TotalTax",
"description": ""
},
{
"key": "SubTotal",
"description": ""
},
{
"key": "AmountDue",
"description": ""
},
{
"key": "PreviousUnpaidBalance",
"description": ""
}
]Per ulteriori esempi di scrittura delle descrizioni, vedere Procedure ottimali per le descrizioni personalizzate.
Uso delle chiavi di sistema e delle chiavi personalizzate
Document Understanding fornisce un set di chiavi di sistema predefinite. Queste chiavi sono ottimizzate per funzionare con vari tipi di documento e layout. È possibile riutilizzare tali chiavi così com'è o modificarne la descrizione.
Inizia con le chiavi fornite dal sistema
Iniziare utilizzando le definizioni di chiave di sistema predefinite e valutarne le prestazioni su un campione rappresentativo dei documenti. Per un elenco delle chiavi fornite dal sistema, vedere Estrazione del valore chiave.
- Se i risultati soddisfano i requisiti, riutilizzare le chiavi fornite dal sistema.
- Non è necessario aggiungere descrizioni per queste chiavi.
Personalizzare le descrizioni delle chiavi quando necessario
Se una chiave fornita dal sistema non soddisfa i requisiti, definire una descrizione personalizzata in base ai documenti.
-
Personalizza le descrizioni in base a terminologia, layout e pattern di formattazione specifici del documento.
-
Per le descrizioni, attenersi alle migliori prassi per le descrizioni personalizzate.
Procedure ottimali per le descrizioni personalizzate
Di seguito sono riportate alcune best practice con esempi per la scrittura di descrizioni chiave.
Sii esplicito e inequivocabile
Distinguere chiaramente i campi che potrebbero apparire simili, ad esempio identificatori numerici diversi.
Esempio
"key": "Invoice number"
"description": "A unique alphanumeric identifier assigned to the invoice.
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice,
often right after the text label." Descrivere le variazioni di contesto ed etichetta
I modelli generativi si basano molto sul testo e sulle etichette circostanti. Includi varianti di etichette comuni.
Esempio
"key": "Company GST Number" "description": "Company GST number,
often labeled as GSTIN, GST No., or Tax ID. Usually appears
in the header with other business identifiers."Specificare i formati dei valori previsti
Se il campo segue un formato noto, specificarlo in modo esplicito.
Esempio
"key": "Invoice Date" "description": "Date the invoice was issued.
Common formats include DD-MM-YYYY or MM/DD/YYYY."Chiarire cosa escludere
Identifica esplicitamente campi simili che non si desidera estrarre.
Esempio
"key": "Total Amount" "description": "Total amount due.
Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."Includi sinonimi e variazioni di etichette
Fornire etichette diverse per migliorare la solidità tra le varianti dei documenti.
Esempio
"key": "Customer Phone Number" "description": "Customer phone number.
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the
customer name or address."Aggiungi suggerimenti posizione di riferimento
Se i documenti seguono layout coerenti, includere indicazioni di posizione relative.
Esempio
"key": "Supplier Address" "description": "Supplier address
located under the business name in the top-left area of the first page." Includi esempi quando utili
Gli esempi concreti migliorano la precisione dell'estrazione.
Esempio
"key": "Invoice Date" "description": "Invoice date,
for example 24-12-2025 or Dec 24, 2025.
Usually follows labels such as Date or Invoice Date."Sii conciso e preciso
Preferire una frase descrittiva chiara integrata da vincoli o esempi essenziali.
Definisci comportamento di fallback
Se applicabile, specificare come derivare i valori se manca l'etichetta principale.
Esempio:
Se manca il totale fattura, utilizzare invece l'importo totale dovuto.
Codifica la consapevolezza della sezione in modo esplicito
Per i documenti multisezione (ad esempio i form), specificare il contesto della sezione e l'ordinazione del campo.
Esempio
"key": "First Name" "description": "Person’s given name.
Appears under the Personal Information or Applicant Details section header.
Usually the first field in the section and appears before Last Name.
Might contain multiple words (for example, MaryAnn)."Gestisci valori multi-parola e multi-riga
Consenti esplicitamente l'estrazione multi-token o multi-linea, se applicabile.
Esempio
"key": "Address" "description": "Full residential address.
May span multiple consecutive lines within the same section.
Extract all adjacent address lines as a single value."Utilizzare linee guida negative per evitare falsi positivi
Indicare esplicitamente da dove non devono essere estratti i valori.
Esempio
"key": "Applicant Name" "description": "Applicant name.
Do not extract names appearing in signature blocks, declaration sections,
or references to officials or witnesses."Gestione dei campi senza etichette esplicite
Per i campi impliciti, fare affidamento sul ruolo semantico e sui segnali di layout:
-
Posizione rispetto alle intestazioni di sezione
-
Ordinare tra i campi vicini
-
Vicinanza alle etichette correlate
Frasi di esempio
- Viene visualizzato subito dopo...
- Situato vicino a...
- Segue l'intestazione della sezione…
Creazione di un modello generativo personalizzato
Per creare un modello personalizzato per l'estrazione del valore chiave utilizzando l'intelligenza artificiale generativa, effettuare le operazioni riportate di seguito.
Seleziona dati
Crea un modello generativo personalizzato KV (Key-Value) utilizzando Document Understanding.
Forma modello
Revisione
- Rivedere le informazioni fornite nei passi precedenti. È possibile apportare modifiche selezionando Precedente o Modifica.
- Quando si è soddisfatti delle selezioni, selezionare Crea e addestra.
Test del modello
- Dopo aver creato il modello personalizzato, nella pagina dei dettagli del modello andare alla sezione Analizza.
- Caricare un documento da un file locale o da uno storage degli oggetti per eseguire il test del modello personalizzato.
- Selezionare Analizza.
- Esaminare le chiavi e i relativi valori estratti.
- Se non sei soddisfatto dei risultati, ad esempio, per aggiungere una chiave o aggiornare una descrizione, aggiorna il file JSON e ripeti i passi precedenti.