Procédure de classification de documents et d'extraction de valeur de clé

Utilisez des modèles OCI Document Understanding prédéfinis pour intégrer la classification de documents et l'extraction de valeur de clé à vos applications sans expertise particulière en matière d'apprentissage automatique ou d'intelligence artificielle. Par exemple, vous pouvez utiliser la classification de documents pour identifier des passeports, des permis de conduire, des reçus et des factures.

Si vous avez moins de 10 000 documents, vous pouvez les traiter en un seul flux de données. Si vous avez plus de 10 000 documents, créez un flux de données distinct pour traiter chaque bucket (autrement dit, utilisez un ensemble de données distinct pour chaque bucket) et utilisez une séquence pour traiter de manière séquentielle les ensembles de données. Reportez-vous à Traitement des données à l'aide d'une séquence de flux de données.
Prérequis :
  1. Sur la page d'accueil Oracle Analytics, cliquez sur Créez puis sur Flux de données.
  2. Sélectionnez l'ensemble de données qui renvoie aux documents à analyser, puis cliquez sur Ajouter.

  3. Dans l'éditeur de flux de données, cliquez sur Ajouter une étape (+).
  4. Dans le panneau Etapes de flux de données, cliquez deux fois sur Appliquer un modèle d'IA, puis sélectionnez le modèle à utiliser.
    Par exemple, vous pouvez sélectionner Classification préentraînée de document pour identifier des passeports.
  5. Dans Appliquer un modèle d'IA, accédez à la section Entrées, puis configurez les paramètres Colonne d'entrée et Type d'entrée.
    • Si vous référencez vos documents source par bucket, dans Colonne d'entrée, sélectionnez URL, puis dans Type d'entrée, sélectionnez Buckets.

    • Si vous référencez vos documents source de façon individuelle, dans Colonne d'entrée, sélectionnez Emplacement de fichier, puis dans Type d'entrée, sélectionnez Documents.
  6. Dans l'éditeur de flux de données, cliquez sur Ajouter une étape (+), puis sélectionnez Enregistrer les données.
  7. Dans Nom, entrez le nom de l'ensemble de données de sortie.
    Par exemple, vous pouvez appeler l'ensemble de données "Résultats d'analyse d'identification de passeport".
  8. Dans le champ Enregistrer les données dans, indiquez l'emplacement de l'ensemble de données de sortie.
  9. Cliquez sur Enregistrer, entrez le nom du flux de données, puis cliquez sur OK.
  10. Cliquez sur Exécuter le flux de données.
Lorsque le flux de données a terminé l'analyse, ouvrez l'ensemble de données que vous avez indiqué à l'étape 7.

Pour localiser l'ensemble de données généré, sur la page d'accueil d'Oracle Analytics, accédez à Données puis à Ensembles de données.
La description de GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png est la suivante
.png

Pour plus d'informations sur les résultats générés, reportez-vous à Données de sortie générées pour les modèles OCI Document Understanding.