Creazione di un modello generativo personalizzato V2.0 (nuovo)

OCI Document Service offre l'estrazione di valore chiave basata su LMM (Large Multimodal Models), che offre maggiore precisione e adattabilità rispetto ai metodi convenzionali basati su modelli.

Informazioni

L'estrazione del valore chiave del servizio OCI Document utilizza un ragionamento multimodale per analizzare sia i contenuti testuali che i layout visivi, rendendolo altamente efficace per la gestione di documenti con formati, modelli e strutture diversi. È possibile fornire uno schema che descriva le chiavi (campi) necessarie per l'estrazione, consentendo al servizio di adattarsi a diversi tipi di documento senza la necessità di riqualificare il modello.

Questo ampio approccio basato su modelli multimodali (LMM) risplende in situazioni che implicano incoerenze di layout, etichettatura irregolare o dati di formazione scarsi, circostanze in cui i modelli tradizionali o le soluzioni basate su modelli richiedono spesso aggiornamenti e manutenzione continui.

Regioni disponibili

Puoi creare modelli personalizzati per l'estrazione del valore chiave basato su modello multimodale generativo di grandi dimensioni (LMM) nelle seguenti aree OCI:

Nome dell'area Posizione Identificativo dell'area Chiave area
Brasile (Est) - San Paolo San Paolo sa-saopaulo-1 GRU
Giappone centrale (Osaka) Osaka ap-osaka-1 KIX
Regno Unito (Sud) - Londra Londra uk-london-1 LHR
Stati Uniti (Midwest) - Chicago Chicago us-chicago-1 ORD

Informazioni su Aree e domini di disponibile.

Creazione di un file JSON per chiavi e valori

Con l'estrazione generativa, è possibile specificare le informazioni da estrarre definendo uno schema. Lo schema funge da set di istruzioni che descrivono le chiavi (campi) di interesse e i relativi valori previsti. In base a queste istruzioni, il modello identifica ed estrae i valori tra i documenti con le specifiche.

  1. Definisci schema JSON: crea un file JSON contenente un array di oggetti, in cui ogni oggetto rappresenta una chiave da estrarre.
  2. Specifica proprietà chiave: creare ogni oggetto nell'array con le proprietà riportate di seguito.
    • key: il nome della chiave da estrarre (obbligatorio).
    • dataType: tipo di dati previsto (facoltativo).
    • description: descrizione in linguaggio naturale della chiave (obbligatorio).
  3. Immettere le chiavi: per i nomi delle chiavi, vedere Utilizzo delle chiavi di sistema e delle chiavi personalizzate.
  4. (Facoltativo) Aggiungere un tipo di dati facoltativo: se è necessario un tipo di dati specifico per una qualsiasi delle chiavi, per la proprietà dataType assegnare uno dei valori seguenti:
    • string
    • date
    • number
    • currency
    • phone
  5. Usa linguaggio naturale per le descrizioni: nella proprietà description fornire dettagli chiari e contestuali in inglese semplice per guidare il modello di intelligenza artificiale generativa nell'identificazione ed estrazione dei valori corretti.

    I documenti analizzati con questo modello personalizzato possono essere in varie lingue, come indicato nella colonna versione 2 per l'estrazione del valore della chiave personalizzata nella tabella Lingue supportate.

    Una descrizione efficace chiarisce esplicitamente:

    • Definizione del campo.

    • Dove viene in genere visualizzato nel documento (posizione visiva o contestuale), ad esempio l'angolo in alto a destra.

    • Modalità di formattazione (modelli, separatori, vincoli), ad esempio i formati di data.

    • Cosa escludere, incluso il testo visivamente o semanticamente simile che non si desidera estrarre.

  6. Popola il file JSON: aggiungi le chiavi richieste e le relative descrizioni. È possibile lasciare il campo description come stringa vuota se si preferisce che il modello derivi il valore.
  7. In un'area supportata, salvare questo file JSON in un bucket di storage degli oggetti nella tenancy.
File JSON di esempio

Ecco un esempio di file JSON per l'estrazione key-value:

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]
Suggerimento

Per ulteriori esempi di scrittura delle descrizioni, vedere Procedure ottimali per le descrizioni personalizzate.

Uso delle chiavi di sistema e delle chiavi personalizzate

Document Understanding fornisce un set di chiavi di sistema predefinite. Queste chiavi sono ottimizzate per funzionare con vari tipi di documento e layout. È possibile riutilizzare tali chiavi così com'è o modificarne la descrizione.

Inizia con le chiavi fornite dal sistema

Iniziare utilizzando le definizioni di chiave di sistema predefinite e valutarne le prestazioni su un campione rappresentativo dei documenti. Per un elenco delle chiavi fornite dal sistema, vedere Estrazione del valore chiave.

  • Se i risultati soddisfano i requisiti, riutilizzare le chiavi fornite dal sistema.
  • Non è necessario aggiungere descrizioni per queste chiavi.

Personalizzare le descrizioni delle chiavi quando necessario

Se una chiave fornita dal sistema non soddisfa i requisiti, definire una descrizione personalizzata in base ai documenti.

Procedure ottimali per le descrizioni personalizzate

Di seguito sono riportate alcune best practice con esempi per la scrittura di descrizioni chiave.

Sii esplicito e inequivocabile

Distinguere chiaramente i campi che potrebbero apparire simili, ad esempio identificatori numerici diversi.

Esempio

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label." 

Descrivere le variazioni di contesto ed etichetta

I modelli generativi si basano molto sul testo e sulle etichette circostanti. Includi varianti di etichette comuni.

Esempio

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Specificare i formati dei valori previsti

Se il campo segue un formato noto, specificarlo in modo esplicito.

Esempio

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Chiarire cosa escludere

Identifica esplicitamente campi simili che non si desidera estrarre.

Esempio

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Includi sinonimi e variazioni di etichette

Fornire etichette diverse per migliorare la solidità tra le varianti dei documenti.

Esempio

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Aggiungi suggerimenti posizione di riferimento

Se i documenti seguono layout coerenti, includere indicazioni di posizione relative.

Esempio

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page." 

Includi esempi quando utili

Gli esempi concreti migliorano la precisione dell'estrazione.

Esempio

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Sii conciso e preciso

Preferire una frase descrittiva chiara integrata da vincoli o esempi essenziali.

Definisci comportamento di fallback

Se applicabile, specificare come derivare i valori se manca l'etichetta principale.

Esempio:

Se manca il totale fattura, utilizzare invece l'importo totale dovuto.

Codifica la consapevolezza della sezione in modo esplicito

Per i documenti multisezione (ad esempio i form), specificare il contesto della sezione e l'ordinazione del campo.

Esempio

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Gestisci valori multi-parola e multi-riga

Consenti esplicitamente l'estrazione multi-token o multi-linea, se applicabile.

Esempio

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Utilizzare linee guida negative per evitare falsi positivi

Indicare esplicitamente da dove non devono essere estratti i valori.

Esempio

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Gestione dei campi senza etichette esplicite

Per i campi impliciti, fare affidamento sul ruolo semantico e sui segnali di layout:

  • Posizione rispetto alle intestazioni di sezione

  • Ordinare tra i campi vicini

  • Vicinanza alle etichette correlate

Frasi di esempio

  • Viene visualizzato subito dopo...
  • Situato vicino a...
  • Segue l'intestazione della sezione…

Creazione di un modello generativo personalizzato

Per creare un modello personalizzato per l'estrazione del valore chiave utilizzando l'intelligenza artificiale generativa, effettuare le operazioni riportate di seguito.

Seleziona dati

Crea un modello generativo personalizzato KV (Key-Value) utilizzando Document Understanding.

  1. Passare alla pagina elenco Progetti. Per assistenza nella ricerca della pagina elenco, vedere Elenca progetti.
  2. Eseguire una delle seguenti opzioni:
    • Se non si dispone di un progetto esistente, creare un progetto, quindi selezionare il progetto.
    • Se si dispone di un progetto esistente, selezionarlo dall'elenco.
  3. Nella pagina dei dettagli del progetto, selezionare Crea modello. Se è necessaria assistenza per trovare la pagina dei dettagli del progetto, vedere Visualizzazione di un progetto.
  4. Selezionare Crea modello.
  5. Per i dettagli del modello, selezionare quanto segue:
    • Scegli il tipo di modelli da addestrare: estrazione dei valori chiave
    • Versione modello: V2.0 (estrazione generativa)
  6. Per Dati formazione, selezionare Scegli set di dati esistente.
  7. Per Origine dati, selezionare Storage oggetti.
  8. Selezionare il bucket che contiene il file JSON preparato in Creazione di un file JSON per chiavi e valori. Se il bucket si trova in un compartimento diverso da questo progetto, selezionare il compartimento con il bucket.
  9. Per File di etichettatura dei dati, selezionare il file JSON, quindi selezionare Successivo.

Forma modello

  1. Immettere un nome per il modello personalizzato.
  2. (Facoltativo) Dare al modello una descrizione utile per trovarlo.
  3. Inference Unit Count è una risorsa di computazione dedicata all'endpoint ed è impostata su 1. Non è possibile modificarlo.
  4. In Lingua del documento di formazione, selezionare EN per l'inglese.
  5. In Durata formazione selezionare una delle opzioni riportate di seguito.
    • Formazione consigliata: Document Understanding seleziona automaticamente la durata dell'addestramento per creare il modello migliore. L'allenamento può richiedere fino a 24 ore.
    • Personalizzato: con questa opzione è possibile impostare la durata massima della formazione (in ore).
  6. Selezionare Next.

Revisione

  1. Rivedere le informazioni fornite nei passi precedenti. È possibile apportare modifiche selezionando Precedente o Modifica.
  2. Quando si è soddisfatti delle selezioni, selezionare Crea e addestra.

Test del modello

  1. Dopo aver creato il modello personalizzato, nella pagina dei dettagli del modello andare alla sezione Analizza.
  2. Caricare un documento da un file locale o da uno storage degli oggetti per eseguire il test del modello personalizzato.
  3. Selezionare Analizza.
  4. Esaminare le chiavi e i relativi valori estratti.
  5. Se non sei soddisfatto dei risultati, ad esempio, per aggiungere una chiave o aggiornare una descrizione, aggiorna il file JSON e ripeti i passi precedenti.