Création d'un modèle personnalisé

Document Understanding offre une option permettant de créer des modèles personnalisés pour extraire des informations à partir d'images sans avoir besoin d'analystes de données.

Vous devez disposer des éléments suivants avant de créer un modèle personnalisé :

  • Compte de location payant dans Oracle Cloud Infrastructure.
  • Bonne connaissance d'Oracle Cloud Infrastructure Object Storage.
  • Configuration des stratégies correctes.

Entraînez le modèle à l'aide de l'un des modes d'entraînement de modèle personnalisés de Document Understanding. Les modes de formation sont les suivants :

  • Formation recommandée : Document Understanding sélectionne automatiquement la durée d'entraînement pour créer le meilleur modèle. La formation peut prendre jusqu'à 24 heures.
  • Durée personnalisée : cette option vous permet de définir la durée d'entraînement maximale.

La meilleure durée d'entraînement dépend de la complexité du problème de détection, du nombre typique d'étiquettes dans un document, de la résolution et d'autres facteurs. Tenez compte de ces besoins et allouez plus de temps à mesure que la complexité de la formation augmente. Le temps d'entraînement minimum recommandé est de 30 minutes. Un temps d'entraînement plus long donne une plus grande précision, mais donne des rendements de précision décroissants avec le temps. Utilisez le mode recommandé pour obtenir un modèle optimisé de base. Si vous voulez un meilleur résultat, augmentez le temps d'entraînement.

  • Vous avez besoin d'un projet pour créer un modèle. Si vous n'en avez pas, reportez-vous à la rubrique Création d'un projet.
    1. Sur la page de détails du projet, sélectionnez Créer un modèle. Si vous avez besoin d'aide pour trouver la page de détails du projet, reportez-vous à la rubrique Affichage d'un projet.
    2. Sélectionnez le type de modèle à entraîner : Classification de document ou Extraction de valeur clé.
      Pour obtenir une description de ces types, reportez-vous à la rubrique A propos des modèles personnalisés.
    3. Sélectionnez les données d'entraînement.
      • Si vous n'avez pas de documents annotés, choisissez Créer un ensemble de données. Vous êtes redirigé vers Oracle Cloud Infrastructure Data Labeling, où vous pouvez facilement ajouter des libellés au contenu du document. Pour plus d'informations sur l'annotation de documents dans Data Labeling, reportez-vous à la section Etiquetage de documents.
      • Si vous disposez de documents annotés, Choisissez un ensemble de données existant.
        • Si vous avez annoté l'ensemble de données dans Data Labeling, sélectionnez Service Data Labeling.
        • Si vous avez annoté les images à l'aide d'un outil tiers, sélectionnez Object Storage.
    4. Sélectionnez Suivant.
    5. Entrez un nom ou un modèle personnalisé.
    6. (Facultatif) Donnez une description au modèle pour l'aider à le trouver.
    7. Sélectionnez la durée de l'entraînement :
      • Formation recommandée : Document Understanding sélectionne automatiquement la durée d'entraînement pour créer le meilleur modèle. La formation peut prendre jusqu'à 24 heures.
      • Personnalisé : cette option vous permet de définir la durée d'entraînement maximale (en heures).
    8. Sélectionnez Suivant.
    9. Passez en revue les informations fournies dans les étapes précédentes. Vous pouvez apporter des modifications, en sélectionnant Précédent.
    10. Lorsque vous souhaitez commencer à entraîner le modèle personnalisé, sélectionnez Créer et entraîner.
  • Utilisez la commande create et les paramètres requis pour créer un modèle :

    oci ai-document model create [OPTIONS]

    Afin d'obtenir la liste complète des indicateurs et des options de variable pour les commandes d'interface de ligne de commande, reportez-vous à Référence de commande d'interface de ligne de commande.

  • Exécutez l'opération CreateProject pour créer un projet.

    Exécutez l'opération CreateModel pour créer un modèle.