Création d'un modèle génératif personnalisé V2.0 (Nouveau)

OCI Document Service propose une extraction clé-valeur optimisée par de grands modèles multimodaux (LMM), offrant une précision et une adaptabilité améliorées par rapport aux méthodes conventionnelles basées sur des modèles.

A propos

L'extraction clé-valeur du service OCI Document utilise le raisonnement multimodal pour analyser le contenu textuel et les présentations visuelles, ce qui le rend très efficace pour gérer des documents avec des formats, des modèles et des structures variés. Vous pouvez fournir un schéma décrivant les clés (champs) requises pour l'extraction, ce qui permet au service de s'adapter à différents types de document sans nécessiter de réentraînement de modèle.

Cette grande approche basée sur un modèle multimodal (LMM) brille dans des situations impliquant des incohérences de mise en page, des étiquettes irrégulières ou des données d'entraînement rares, dans lesquelles les modèles traditionnels ou les solutions basées sur des modèles exigent souvent des mises à jour et une maintenance continues.

Régions disponibles

Vous pouvez créer des modèles personnalisés pour l'extraction de valeur-clé basée sur un grand modèle multimodal génératif (LMM) dans les régions OCI suivantes :

Nom de région Lieu Identifiant de la région Clé de la région
Est du Brésil (São Paulo) São Paulo sa-saopaulo-1 GRU
Centre du Japon (Osaka) Osaka ap-osaka-1 KIX
Sud du Royaume-Uni (Londres) Londres uk-london-1 LHR
Midwest des Etats-Unis (Chicago) Chicago us-chicago-1 ORD

Découvrez A propos des régions et des domaines de disponible.

Créer un fichier JSON pour les clés et les valeurs

Avec l'extraction générative, vous indiquez les informations à extraire en définissant un schéma. Le schéma agit comme un ensemble d'instructions décrivant les clés (champs) qui vous intéressent et leurs valeurs attendues. En fonction de ces instructions, le modèle identifie et extrait les valeurs dans les documents avec vos spécificités.

  1. Définir le schéma JSON : créez un fichier JSON qui contient un tableau d'objets, chaque objet représentant une clé à extraire.
  2. Spécifier les propriétés de clé : créez chaque objet du tableau avec les propriétés suivantes :
    • key : nom de la clé à extraire (obligatoire).
    • dataType : type de données attendu (facultatif).
    • description : description en langage naturel de la clé (obligatoire).
  3. Entrez les clés : pour les noms de clé, reportez-vous à la section Using System Keys and Custom Keys.
  4. (Facultatif) Ajoutez un type de données facultatif : si vous avez besoin d'un type de données spécifique pour l'une des clés, affectez l'une des valeurs suivantes à la propriété dataType :
    • string
    • date
    • number
    • currency
    • phone
  5. Utilisation du langage naturel pour les descriptions : dans la propriété description, fournissez des détails contextuels clairs en anglais simple pour guider le modèle d'IA générative dans l'identification et l'extraction des valeurs correctes.

    Les documents analysés avec ce modèle personnalisé peuvent être en plusieurs langues, comme indiqué dans la colonne version 2 pour l'extraction clé-valeur personnalisée dans la table Langues prises en charge.

    Une description efficace clarifie explicitement :

    • Qu'est-ce que le champ représente ?

    • il apparaît généralement dans le document (emplacement visuel ou contextuel), tel que le coin supérieur droit.

    • Comment il est formaté (modèles, séparateurs, contraintes), tels que les formats de date.

    • Eléments à exclure, y compris les textes visuellement ou sémantiquement similaires que vous ne voulez pas extraire.

  6. Renseigner le fichier JSON : ajoutez les clés requises et leurs descriptions. Vous pouvez laisser le champ description comme chaîne vide si vous préférez que le modèle déduise la valeur.
  7. Dans une région prise en charge, enregistrez ce fichier JSON dans un bucket Object Storage de votre location.
Exemple de fichier JSON

Voici un exemple de fichier JSON pour l'extraction clé-valeur :

[
                    {
                    "key": "InvoiceId",
                    "dataType": "String",
                    "description": "A unique alphanumeric identifier assigned to the invoice. Usually labelled Invoice No., Inv #, 
Bill Number and appears near the top of the invoice, often right after the text label."
                    },
                    {
                    "key": "InvoiceDate",
                    "description": "Date the invoice was issued. Common formats include DD-MM-YYYY or MM/DD/YYYY."
                    },
                    {
                    "key": "DueDate",
                    "description": ""
                    },
                    {
                    "key": "PurchaseOrder",
                    "description": ""
                    },
                    {
                    "key": "InvoiceTotal",
                    "description": "Total amount due. Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."
                    },
                    {
                    "key": "TotalTax",
                    "description": ""
                    },
                    {
                    "key": "SubTotal",
                    "description": ""
                    },
                    {
                    "key": "AmountDue",
                    "description": ""
                    },
                    {
                    "key": "PreviousUnpaidBalance",
                    "description": ""
                    }
                    ]
Conseil

Pour plus d'exemples d'écriture de descriptions, reportez-vous à Meilleures pratiques pour les descriptions personnalisées.

Utilisation de clés système et de clés personnalisées

Document Understanding fournit un ensemble de clés système prédéfinies. Ces clés sont réglées pour fonctionner avec différents types de document et présentations. Vous pouvez réutiliser ces clés telles quelles ou modifier leur description.

Commencer par les clés fournies par le système

Commencez par utiliser les définitions de clé système prédéfinies et évaluez leurs performances sur un échantillon représentatif de vos documents. Pour obtenir la liste des clés fournies par le système, reportez-vous à Extraction de clé-valeur.

  • Si les résultats répondent aux exigences, réutilisez les clés fournies par le système.
  • Vous n'avez pas besoin d'ajouter de descriptions pour ces clés.

Personnaliser les descriptions des clés si nécessaire

Si une clé fournie par le système ne répond pas aux exigences, définissez une description personnalisée basée sur les documents.

Meilleures pratiques pour les descriptions personnalisées

Voici quelques bonnes pratiques avec des exemples pour la rédaction de descriptions de clés :

Soyez explicite et sans ambiguïté

Faites une distinction claire entre les champs qui peuvent sembler similaires, tels que différents identificateurs numériques.

Exemple

"key": "Invoice number"   
"description": "A unique alphanumeric identifier assigned to the invoice. 
Usually labeled Invoice No., Inv #, Bill Number and appears near the top of the invoice, 
often right after the text label." 

Décrire les variations de contexte et de libellé

Les modèles génératifs reposent fortement sur le texte et les libellés environnants. Inclure les variantes d'étiquette communes.

Exemple

"key": "Company GST Number" "description": "Company GST number, 
often labeled as GSTIN, GST No., or Tax ID. Usually appears 
in the header with other business identifiers."

Spécifier les formats de valeur attendue

Si le champ suit un format connu, indiquez-le de manière explicite.

Exemple

"key": "Invoice Date" "description": "Date the invoice was issued. 
Common formats include DD-MM-YYYY or MM/DD/YYYY."

Clarifier ce qu'il faut exclure

Identifiez explicitement les champs similaires que vous ne voulez pas extraire.

Exemple

"key": "Total Amount" "description": "Total amount due. 
Exclude subtotals, taxes, and discounts. 
Look for labels such as Grand Total, Amount Payable, or Balance Due near the bottom of the document."

Inclure les synonymes et les variantes de libellé

Fournissez différentes étiquettes pour améliorer la robustesse des variantes de documents.

Exemple

"key": "Customer Phone Number" "description": "Customer phone number. 
A 10-digit numeric value labeled as Phone, Tel, Contact, or Mobile, typically adjacent to the 
customer name or address."

Ajouter des conseils d'emplacement de référence

Si les documents suivent des mises en page cohérentes, incluez des repères de position relatifs.

Exemple

"key": "Supplier Address" "description": "Supplier address 
located under the business name in the top-left area of the first page." 

Inclure des exemples si utile

Des exemples concrets améliorent la précision de l'extraction.

Exemple

"key": "Invoice Date" "description": "Invoice date, 
for example 24-12-2025 or Dec 24, 2025. 
Usually follows labels such as Date or Invoice Date."

Soyez concis et précis

Préférez une phrase descriptive claire complétée par des contraintes ou des exemples essentiels.

Définir le comportement de restauration

Le cas échéant, indiquez comment inférer des valeurs si l'étiquette principale est manquante.

Exemple :

Si le total de la facture est manquant, utilisez plutôt le montant total dû.

Coder explicitement la connaissance des sections

Pour les documents à sections multiples (tels que les formulaires), spécifiez le contexte de section et l'ordre des champs.

Exemple

"key": "First Name" "description": "Person’s given name. 
Appears under the Personal Information or Applicant   Details section header. 
Usually the first field in the section and appears before Last Name. 
Might contain multiple words (for example, MaryAnn)."

Gérer les valeurs de plusieurs mots et de plusieurs lignes

Permet explicitement l'extraction de plusieurs jetons ou de plusieurs lignes, le cas échéant.

Exemple

"key": "Address" "description": "Full residential address. 
May span multiple consecutive lines within the same section. 
Extract all adjacent address lines as a single value."

Utiliser des conseils négatifs pour éviter les faux positifs

Indique explicitement à partir de laquelle les valeurs ne doivent pas être extraites.

Exemple

"key": "Applicant Name" "description": "Applicant name. 
Do not extract names appearing in signature blocks, declaration sections, 
or references to officials or witnesses."

Gestion des champs sans libellés explicites

Pour les champs implicites, utilisez des repères de rôle et de disposition sémantiques :

  • Position par rapport aux en-têtes de section

  • Ordre parmi les champs voisins

  • Proximité des étiquettes associées

Exemples d'expressions

  • Apparaît immédiatement après…
  • Situé à côté de…
  • Suit l'en-tête de section…

Création d'un modèle génératif personnalisé

Pour créer un modèle personnalisé pour l'extraction clé-valeur à l'aide de l'IA générative, procédez comme suit :

Sélectionner des données

Créez un modèle génératif personnalisé Key-Value (KV) à l'aide de Document Understanding.

  1. Accédez à la page de liste Projets. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à la rubrique Liste des projets.
  2. Exécutez l'une des actions suivantes :
    • Si vous n'avez pas de projet existant, créez un projet, puis sélectionnez-le.
    • Si vous avez un projet existant, sélectionnez-le dans la liste.
  3. Sur la page de détails du projet, sélectionnez Créer un modèle. Si vous avez besoin d'aide pour trouver la page de détails du projet, reportez-vous à la rubrique Visualisation d'un projet.
  4. Sélectionnez Créer un modèle.
  5. Pour les détails du modèle, sélectionnez les éléments suivants :
    • Choisir le type de Modèle à entrainer : extraction de valeur de clé
    • Version du modèle : V2.0 (extraction générative)
  6. Pour Données d'entraînement, sélectionnez Choisir un ensemble de données existant.
  7. Dans Source de données, sélectionnez Object Storage.
  8. Sélectionnez le bucket contenant le fichier JSON que vous avez préparé dans Création d'un fichier JSON pour les clés et les valeurs. Si le bucket se trouve dans un compartiment différent de celui de ce projet, sélectionnez-le.
  9. Pour Fichier Data Labeling, sélectionnez le fichier JSON, puis Suivant.

Entraîner le modèle

  1. Saisissez le nom du modèle personnalisé.
  2. (Facultatif) Donnez au modèle une description qui vous aidera à le trouver.
  3. Nombre d'unités d'inférence est une ressource de calcul dédiée à votre adresse et est définie sur 1. Vous n'avez pas la possibilité de le modifier.
  4. Pour Training Document Language, sélectionnez EN pour l'anglais.
  5. Pour Durée de la formation, sélectionnez l'une des options suivantes :
    • Formation recommandée : Document Understanding sélectionne automatiquement la durée d'entraînement pour créer le meilleur modèle. La formation peut prendre jusqu'à 24 heures.
    • Personnalisé : avec cette option, vous pouvez définir la durée de formation maximale (en heures).
  6. Sélectionnez Suivant.

Révision

  1. Consultez les informations que vous avez fournies lors des étapes précédentes. Vous pouvez apporter des modifications en sélectionnant Précédent ou Modifier.
  2. Lorsque vous êtes satisfait des sélections, sélectionnez Créer et entraîner.

Tester le modèle

  1. Une fois le modèle personnalisé créé, accédez à la section Analyser sur la page de détails du modèle.
  2. Téléchargez un document à partir d'un fichier local ou d'Object Storage pour tester le modèle personnalisé.
  3. Sélectionnez Analyser.
  4. Vérifiez les clés et leurs valeurs extraites.
  5. Si vous n'êtes pas satisfait des résultats, par exemple, pour ajouter une clé ou mettre à jour une description, mettez à jour votre fichier JSON et répétez les étapes précédentes.