Création d'un modèle génératif personnalisé V2.0 (Nouveau)
OCI Document Service propose une extraction clé-valeur optimisée par de grands modèles multimodaux (LMM), offrant une précision et une adaptabilité améliorées par rapport aux méthodes conventionnelles basées sur des modèles.
A propos
L'extraction clé-valeur du service OCI Document utilise le raisonnement multimodal pour analyser le contenu textuel et les présentations visuelles, ce qui le rend très efficace pour gérer des documents avec des formats, des modèles et des structures variés. Vous pouvez fournir un schéma décrivant les clés (champs) requises pour l'extraction, ce qui permet au service de s'adapter à différents types de document sans nécessiter de réentraînement de modèle.
Cette grande approche basée sur un modèle multimodal (LMM) brille dans des situations impliquant des incohérences de mise en page, des étiquettes irrégulières ou des données d'entraînement rares, dans lesquelles les modèles traditionnels ou les solutions basées sur des modèles exigent souvent des mises à jour et une maintenance continues.
Régions disponibles
Vous pouvez créer des modèles personnalisés pour l'extraction de valeur-clé basée sur un grand modèle multimodal génératif (LMM) dans les régions OCI suivantes :
| Nom de région | Lieu | Identifiant de la région | Clé de la région |
|---|---|---|---|
| Est du Brésil (São Paulo) | São Paulo |
sa-saopaulo-1
|
GRU
|
| Centre du Japon (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Sud du Royaume-Uni (Londres) | Londres |
uk-london-1
|
LHR
|
| Midwest des Etats-Unis (Chicago) | Chicago |
us-chicago-1
|
ORD
|
Découvrez A propos des régions et des domaines de disponible.
Ajouter des autorisations
Ajoutez des droits d'accès à l'aide de stratégies IAM :
Créer un fichier JSON pour les clés et les valeurs
Avec l'extraction générative, vous indiquez les informations à extraire en définissant un schéma. Le schéma agit comme un ensemble d'instructions décrivant les clés (champs) qui vous intéressent et leurs valeurs attendues. En fonction de ces instructions, le modèle identifie et extrait les valeurs dans les documents avec vos spécificités.
Voici un exemple de fichier JSON pour l'extraction clé-valeur :
[
{
"key": "InvoiceId",
"dataType": "String",
"description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #,
Bill Number and appears near the top of the invoice, often right after the text label."
},
{
"key": "InvoiceDate",
"description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
},
{
"key": "DueDate",
"description": ""
},
{
"key": "PurchaseOrder",
"description": ""
},
{
"key": "InvoiceTotal",
"description": "Total amount due. Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
},
{
"key": "TotalTax",
"description": ""
},
{
"key": "SubTotal",
"description": ""
},
{
"key": "AmountDue",
"description": ""
},
{
"key": "PreviousUnpaidBalance",
"description": ""
}
]Pour plus d'exemples d'écriture de descriptions, reportez-vous à Meilleures pratiques pour les descriptions personnalisées.
Utilisation de clés système et de clés personnalisées
Document Understanding fournit un ensemble de clés système prédéfinies. Ces clés sont réglées pour fonctionner avec différents types de document et présentations. Vous pouvez réutiliser ces clés telles quelles ou modifier leur description.
Commencer par les clés fournies par le système
Commencez par utiliser les définitions de clé système prédéfinies et évaluez leurs performances sur un échantillon représentatif de vos documents. Pour obtenir la liste des clés fournies par le système, reportez-vous à Extraction de clé-valeur.
- Si les résultats répondent aux exigences, réutilisez les clés fournies par le système.
- Vous n'avez pas besoin d'ajouter de descriptions pour ces clés.
Personnaliser les descriptions des clés si nécessaire
Si une clé fournie par le système ne répond pas aux exigences, définissez une description personnalisée basée sur les documents.
-
Adaptez les descriptions à la terminologie, aux mises en page et aux modèles de formatage propres aux documents.
-
Suivez les Meilleures pratiques pour les descriptions personnalisées pour les descriptions.
Meilleures pratiques pour les descriptions personnalisées
Voici quelques bonnes pratiques avec des exemples pour la rédaction de descriptions de clés :
Soyez explicite et sans ambiguïté
Faites une distinction claire entre les champs qui peuvent sembler similaires, tels que différents identificateurs numériques.
Exemple
"key": "Invoice number"
"description": "A unique alphanumeric identifier assigned to the invoice.
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice,
often right after the text label." Décrire les variations de contexte et de libellé
Les modèles génératifs reposent fortement sur le texte et les libellés environnants. Inclure les variantes d'étiquette communes.
Exemple
"key": "Company GST Number" "description": "Company GST number,
often labeled as GSTIN, GST No., or Tax ID. Usually appears
in the header with other business identifiers."Spécifier les formats de valeur attendue
Si le champ suit un format connu, indiquez-le de manière explicite.
Exemple
"key": "Invoice Date" "description": "Date the invoice was issued.
Common formats include DD-MM-YYYY or MM/DD/YYYY."Clarifier ce qu'il faut exclure
Identifiez explicitement les champs similaires que vous ne voulez pas extraire.
Exemple
"key": "Total Amount" "description": "Total amount due.
Exclude subtotals, taxes, and discounts.
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."Inclure les synonymes et les variantes de libellé
Fournissez différentes étiquettes pour améliorer la robustesse des variantes de documents.
Exemple
"key": "Customer Phone Number" "description": "Customer phone number.
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the
customer name or address."Ajouter des conseils d'emplacement de référence
Si les documents suivent des mises en page cohérentes, incluez des repères de position relatifs.
Exemple
"key": "Supplier Address" "description": "Supplier address
located under the business name in the top-left area of the first page." Inclure des exemples si utile
Des exemples concrets améliorent la précision de l'extraction.
Exemple
"key": "Invoice Date" "description": "Invoice date,
for example 24-12-2025 or Dec 24, 2025.
Usually follows labels such as Date or Invoice Date."Soyez concis et précis
Préférez une phrase descriptive claire complétée par des contraintes ou des exemples essentiels.
Définir le comportement de restauration
Le cas échéant, indiquez comment inférer des valeurs si l'étiquette principale est manquante.
Exemple :
Si le total de la facture est manquant, utilisez plutôt le montant total dû.
Coder explicitement la connaissance des sections
Pour les documents à sections multiples (tels que les formulaires), spécifiez le contexte de section et l'ordre des champs.
Exemple
"key": "First Name" "description": "Person’s given name.
Appears under the Personal Information or Applicant Details section header.
Usually the first field in the section and appears before Last Name.
Might contain multiple words (for example, MaryAnn)."Gérer les valeurs de plusieurs mots et de plusieurs lignes
Permet explicitement l'extraction de plusieurs jetons ou de plusieurs lignes, le cas échéant.
Exemple
"key": "Address" "description": "Full residential address.
May span multiple consecutive lines within the same section.
Extract all adjacent address lines as a single value."Utiliser des conseils négatifs pour éviter les faux positifs
Indique explicitement à partir de laquelle les valeurs ne doivent pas être extraites.
Exemple
"key": "Applicant Name" "description": "Applicant name.
Do not extract names appearing in signature blocks, declaration sections,
or references to officials or witnesses."Gestion des champs sans libellés explicites
Pour les champs implicites, utilisez des repères de rôle et de disposition sémantiques :
-
Position par rapport aux en-têtes de section
-
Ordre parmi les champs voisins
-
Proximité des étiquettes associées
Exemples d'expressions
- Apparaît immédiatement après…
- Situé à côté de…
- Suit l'en-tête de section…
Création d'un modèle génératif personnalisé
Pour créer un modèle personnalisé pour l'extraction clé-valeur à l'aide de l'IA générative, procédez comme suit :
Sélectionner des données
Créez un modèle génératif personnalisé Key-Value (KV) à l'aide de Document Understanding.
Entraîner le modèle
Révision
- Consultez les informations que vous avez fournies lors des étapes précédentes. Vous pouvez apporter des modifications en sélectionnant Précédent ou Modifier.
- Lorsque vous êtes satisfait des sélections, sélectionnez Créer et entraîner.
Tester le modèle
- Une fois le modèle personnalisé créé, accédez à la section Analyser sur la page de détails du modèle.
- Téléchargez un document à partir d'un fichier local ou d'Object Storage pour tester le modèle personnalisé.
- Sélectionnez Analyser.
- Vérifiez les clés et leurs valeurs extraites.
- Si vous n'êtes pas satisfait des résultats, par exemple, pour ajouter une clé ou mettre à jour une description, mettez à jour votre fichier JSON et répétez les étapes précédentes.