Creazione di un modello generativo personalizzato V2.0 (nuovo)

OCI Document Service offre l'estrazione di valore chiave basata su LMM (Large Multimodal Models), che offre maggiore precisione e adattabilità rispetto ai metodi convenzionali basati su modelli.

Informazioni

L'estrazione del valore chiave del servizio OCI Document utilizza un ragionamento multimodale per analizzare sia i contenuti testuali che i layout visivi, rendendolo altamente efficace per la gestione di documenti con formati, modelli e strutture diversi. È possibile fornire uno schema che descriva le chiavi (campi) necessarie per l'estrazione, consentendo al servizio di adattarsi a diversi tipi di documento senza la necessità di riqualificare il modello.

Questo ampio approccio basato su modelli multimodali (LMM) risplende in situazioni che implicano incoerenze di layout, etichettatura irregolare o dati di formazione scarsi, circostanze in cui i modelli tradizionali o le soluzioni basate su modelli richiedono spesso aggiornamenti e manutenzione continui.

Regioni disponibili

Puoi creare modelli personalizzati per l'estrazione del valore chiave basato su modello multimodale generativo di grandi dimensioni (LMM) nelle seguenti aree OCI:


Nome dell'area	Posizione	Identificativo dell'area	Chiave area
Brasile (Est) - San Paolo	San Paolo	`sa-saopaulo-1`	`GRU`
Giappone centrale (Osaka)	Osaka	`ap-osaka-1`	`KIX`
Regno Unito (Sud) - Londra	Londra	`uk-london-1`	`LHR`
Stati Uniti (Midwest) - Chicago	Chicago	`us-chicago-1`	`ORD`

Informazioni su Aree e domini di disponibile.

Aggiunta di autorizzazioni

Aggiungere le autorizzazioni utilizzando i criteri IAM:

Creazione di un file JSON per chiavi e valori

Con l'estrazione generativa, è possibile specificare le informazioni da estrarre definendo uno schema. Lo schema funge da set di istruzioni che descrivono le chiavi (campi) di interesse e i relativi valori previsti. In base a queste istruzioni, il modello identifica ed estrae i valori tra i documenti con le specifiche.

Definisci schema JSON: crea un file JSON contenente un array di oggetti, in cui ogni oggetto rappresenta una chiave da estrarre.
Specifica proprietà chiave: creare ogni oggetto nell'array con le proprietà riportate di seguito.
- key: il nome della chiave da estrarre (obbligatorio).
- dataType: tipo di dati previsto (facoltativo).
- description: descrizione in linguaggio naturale della chiave (obbligatorio).
Immettere le chiavi: per i nomi delle chiavi, vedere Utilizzo delle chiavi di sistema e delle chiavi personalizzate.
(Facoltativo) Aggiungere un tipo di dati facoltativo: se è necessario un tipo di dati specifico per una qualsiasi delle chiavi, per la proprietà dataType assegnare uno dei valori seguenti:
- string
- date
- number
- currency
- phone
Usa linguaggio naturale per le descrizioni: nella proprietà description fornire dettagli chiari e contestuali in inglese semplice per guidare il modello di intelligenza artificiale generativa nell'identificazione ed estrazione dei valori corretti.

I documenti analizzati con questo modello personalizzato possono essere in varie lingue, come indicato nella colonna versione 2 per l'estrazione del valore della chiave personalizzata nella tabella Lingue supportate.
Una descrizione efficace chiarisce esplicitamente:
- Definizione del campo.
- Dove viene in genere visualizzato nel documento (posizione visiva o contestuale), ad esempio l'angolo in alto a destra.
- Modalità di formattazione (modelli, separatori, vincoli), ad esempio i formati di data.
- Cosa escludere, incluso il testo visivamente o semanticamente simile che non si desidera estrarre.
Popola il file JSON: aggiungi le chiavi richieste e le relative descrizioni. È possibile lasciare il campo description come stringa vuota se si preferisce che il modello derivi il valore.
In un'area supportata, salvare questo file JSON in un bucket di storage degli oggetti nella tenancy.

File JSON di esempio

Ecco un esempio di file JSON per l'estrazione key-value:

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]

Suggerimento

Per ulteriori esempi di scrittura delle descrizioni, vedere Procedure ottimali per le descrizioni personalizzate.

Uso delle chiavi di sistema e delle chiavi personalizzate

Document Understanding fornisce un set di chiavi di sistema predefinite. Queste chiavi sono ottimizzate per funzionare con vari tipi di documento e layout. È possibile riutilizzare tali chiavi così com'è o modificarne la descrizione.

Inizia con le chiavi fornite dal sistema

Iniziare utilizzando le definizioni di chiave di sistema predefinite e valutarne le prestazioni su un campione rappresentativo dei documenti. Per un elenco delle chiavi fornite dal sistema, vedere Estrazione del valore chiave.

Se i risultati soddisfano i requisiti, riutilizzare le chiavi fornite dal sistema.
Non è necessario aggiungere descrizioni per queste chiavi.

Personalizzare le descrizioni delle chiavi quando necessario

Se una chiave fornita dal sistema non soddisfa i requisiti, definire una descrizione personalizzata in base ai documenti.

Personalizza le descrizioni in base a terminologia, layout e pattern di formattazione specifici del documento.
Per le descrizioni, attenersi alle migliori prassi per le descrizioni personalizzate.

Procedure ottimali per le descrizioni personalizzate

Di seguito sono riportate alcune best practice con esempi per la scrittura di descrizioni chiave.

Sii esplicito e inequivocabile

Distinguere chiaramente i campi che potrebbero apparire simili, ad esempio identificatori numerici diversi.

Esempio

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label."

Descrivere le variazioni di contesto ed etichetta

I modelli generativi si basano molto sul testo e sulle etichette circostanti. Includi varianti di etichette comuni.

Esempio

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Specificare i formati dei valori previsti

Se il campo segue un formato noto, specificarlo in modo esplicito.

Esempio

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Chiarire cosa escludere

Identifica esplicitamente campi simili che non si desidera estrarre.

Esempio

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Includi sinonimi e variazioni di etichette

Fornire etichette diverse per migliorare la solidità tra le varianti dei documenti.

Esempio

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Aggiungi suggerimenti posizione di riferimento

Se i documenti seguono layout coerenti, includere indicazioni di posizione relative.

Esempio

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page."

Includi esempi quando utili

Gli esempi concreti migliorano la precisione dell'estrazione.

Esempio

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Sii conciso e preciso

Preferire una frase descrittiva chiara integrata da vincoli o esempi essenziali.

Definisci comportamento di fallback

Se applicabile, specificare come derivare i valori se manca l'etichetta principale.

Esempio:

Se manca il totale fattura, utilizzare invece l'importo totale dovuto.

Codifica la consapevolezza della sezione in modo esplicito

Per i documenti multisezione (ad esempio i form), specificare il contesto della sezione e l'ordinazione del campo.

Esempio

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Gestisci valori multi-parola e multi-riga

Consenti esplicitamente l'estrazione multi-token o multi-linea, se applicabile.

Esempio

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Utilizzare linee guida negative per evitare falsi positivi

Indicare esplicitamente da dove non devono essere estratti i valori.

Esempio

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Gestione dei campi senza etichette esplicite

Per i campi impliciti, fare affidamento sul ruolo semantico e sui segnali di layout:

Posizione rispetto alle intestazioni di sezione
Ordinare tra i campi vicini
Vicinanza alle etichette correlate

Frasi di esempio

Viene visualizzato subito dopo...
Situato vicino a...
Segue l'intestazione della sezione…