Création d'un modèle génératif personnalisé V2.0 (Nouveau)

OCI Document Service propose une extraction clé-valeur optimisée par de grands modèles multimodaux (LMM), offrant une précision et une adaptabilité améliorées par rapport aux méthodes conventionnelles basées sur des modèles.

A propos

L'extraction clé-valeur du service OCI Document utilise le raisonnement multimodal pour analyser le contenu textuel et les présentations visuelles, ce qui le rend très efficace pour gérer des documents avec des formats, des modèles et des structures variés. Vous pouvez fournir un schéma décrivant les clés (champs) requises pour l'extraction, ce qui permet au service de s'adapter à différents types de document sans nécessiter de réentraînement de modèle.

Cette grande approche basée sur un modèle multimodal (LMM) brille dans des situations impliquant des incohérences de mise en page, des étiquettes irrégulières ou des données d'entraînement rares, dans lesquelles les modèles traditionnels ou les solutions basées sur des modèles exigent souvent des mises à jour et une maintenance continues.

Régions disponibles

Vous pouvez créer des modèles personnalisés pour l'extraction de valeur-clé basée sur un grand modèle multimodal génératif (LMM) dans les régions OCI suivantes :


Nom de région	Lieu	Identifiant de la région	Clé de la région
Est du Brésil (São Paulo)	São Paulo	`sa-saopaulo-1`	`GRU`
Centre du Japon (Osaka)	Osaka	`ap-osaka-1`	`KIX`
Sud du Royaume-Uni (Londres)	Londres	`uk-london-1`	`LHR`
Midwest des Etats-Unis (Chicago)	Chicago	`us-chicago-1`	`ORD`

Découvrez A propos des régions et des domaines de disponible.

Ajouter des autorisations

Ajoutez des droits d'accès à l'aide de stratégies IAM :

Créer un fichier JSON pour les clés et les valeurs

Avec l'extraction générative, vous indiquez les informations à extraire en définissant un schéma. Le schéma agit comme un ensemble d'instructions décrivant les clés (champs) qui vous intéressent et leurs valeurs attendues. En fonction de ces instructions, le modèle identifie et extrait les valeurs dans les documents avec vos spécificités.

Définir le schéma JSON : créez un fichier JSON qui contient un tableau d'objets, chaque objet représentant une clé à extraire.
Spécifier les propriétés de clé : créez chaque objet du tableau avec les propriétés suivantes :
- key : nom de la clé à extraire (obligatoire).
- dataType : type de données attendu (facultatif).
- description : description en langage naturel de la clé (obligatoire).
Entrez les clés : pour les noms de clé, reportez-vous à la section Using System Keys and Custom Keys.
(Facultatif) Ajoutez un type de données facultatif : si vous avez besoin d'un type de données spécifique pour l'une des clés, affectez l'une des valeurs suivantes à la propriété dataType :
- string
- date
- number
- currency
- phone
Utilisation du langage naturel pour les descriptions : dans la propriété description, fournissez des détails contextuels clairs en anglais simple pour guider le modèle d'IA générative dans l'identification et l'extraction des valeurs correctes.

Les documents analysés avec ce modèle personnalisé peuvent être en plusieurs langues, comme indiqué dans la colonne version 2 pour l'extraction clé-valeur personnalisée dans la table Langues prises en charge.
Une description efficace clarifie explicitement :
- Qu'est-ce que le champ représente ?
- Où il apparaît généralement dans le document (emplacement visuel ou contextuel), tel que le coin supérieur droit.
- Comment il est formaté (modèles, séparateurs, contraintes), tels que les formats de date.
- Eléments à exclure, y compris les textes visuellement ou sémantiquement similaires que vous ne voulez pas extraire.
Renseigner le fichier JSON : ajoutez les clés requises et leurs descriptions. Vous pouvez laisser le champ description comme chaîne vide si vous préférez que le modèle déduise la valeur.
Dans une région prise en charge, enregistrez ce fichier JSON dans un bucket Object Storage de votre location.

Exemple de fichier JSON

Voici un exemple de fichier JSON pour l'extraction clé-valeur :

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]

Conseil

Pour plus d'exemples d'écriture de descriptions, reportez-vous à Meilleures pratiques pour les descriptions personnalisées.

Utilisation de clés système et de clés personnalisées

Document Understanding fournit un ensemble de clés système prédéfinies. Ces clés sont réglées pour fonctionner avec différents types de document et présentations. Vous pouvez réutiliser ces clés telles quelles ou modifier leur description.

Commencer par les clés fournies par le système

Commencez par utiliser les définitions de clé système prédéfinies et évaluez leurs performances sur un échantillon représentatif de vos documents. Pour obtenir la liste des clés fournies par le système, reportez-vous à Extraction de clé-valeur.

Si les résultats répondent aux exigences, réutilisez les clés fournies par le système.
Vous n'avez pas besoin d'ajouter de descriptions pour ces clés.

Personnaliser les descriptions des clés si nécessaire

Si une clé fournie par le système ne répond pas aux exigences, définissez une description personnalisée basée sur les documents.

Adaptez les descriptions à la terminologie, aux mises en page et aux modèles de formatage propres aux documents.
Suivez les Meilleures pratiques pour les descriptions personnalisées pour les descriptions.

Meilleures pratiques pour les descriptions personnalisées

Voici quelques bonnes pratiques avec des exemples pour la rédaction de descriptions de clés :

Soyez explicite et sans ambiguïté

Faites une distinction claire entre les champs qui peuvent sembler similaires, tels que différents identificateurs numériques.

Exemple

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label."

Décrire les variations de contexte et de libellé

Les modèles génératifs reposent fortement sur le texte et les libellés environnants. Inclure les variantes d'étiquette communes.

Exemple

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Spécifier les formats de valeur attendue

Si le champ suit un format connu, indiquez-le de manière explicite.

Exemple

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Clarifier ce qu'il faut exclure

Identifiez explicitement les champs similaires que vous ne voulez pas extraire.

Exemple

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Inclure les synonymes et les variantes de libellé

Fournissez différentes étiquettes pour améliorer la robustesse des variantes de documents.

Exemple

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Ajouter des conseils d'emplacement de référence

Si les documents suivent des mises en page cohérentes, incluez des repères de position relatifs.

Exemple

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page."

Inclure des exemples si utile

Des exemples concrets améliorent la précision de l'extraction.

Exemple

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Soyez concis et précis

Préférez une phrase descriptive claire complétée par des contraintes ou des exemples essentiels.

Définir le comportement de restauration

Le cas échéant, indiquez comment inférer des valeurs si l'étiquette principale est manquante.

Exemple :

Si le total de la facture est manquant, utilisez plutôt le montant total dû.

Coder explicitement la connaissance des sections

Pour les documents à sections multiples (tels que les formulaires), spécifiez le contexte de section et l'ordre des champs.

Exemple

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Gérer les valeurs de plusieurs mots et de plusieurs lignes

Permet explicitement l'extraction de plusieurs jetons ou de plusieurs lignes, le cas échéant.

Exemple

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Utiliser des conseils négatifs pour éviter les faux positifs

Indique explicitement à partir de laquelle les valeurs ne doivent pas être extraites.

Exemple

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Gestion des champs sans libellés explicites

Pour les champs implicites, utilisez des repères de rôle et de disposition sémantiques :

Position par rapport aux en-têtes de section
Ordre parmi les champs voisins
Proximité des étiquettes associées

Exemples d'expressions

Apparaît immédiatement après…
Situé à côté de…
Suit l'en-tête de section…