Aperçu de la classification de documents et de l'extraction de valeurs de clé

Dans l'environnement Oracle Cloud Infrastructure (OCI), le service de compréhension de documents fournit des modèles d'intelligence artificielle préentraînés qui permettent d'extraire du texte, des tables et d'autres données clés dans des fichiers de document. Vous effectuez une classification de documents ou une extraction de valeurs de clé sur un document, puis utilisez les données extraites dans votre analyse dans Oracle Analytics.

Le service de compréhension de documents vous permet également de créer des modèles personnalisés pour l'extraction de valeurs de clé et la classification de documents.

Dans l'environnement Oracle Analytics, vous utilisez des flux de données pour appliquer les modèles d'intelligence artificielle de compréhension de documents à vos données.

Oracle Analytics prend en charge plusieurs modèles d'intelligence artificielle préentraînés et personnalisés disponibles au moyen du service de compréhension de documents :
  • Modèles préentraînés pris en charge dans Oracle Analytics
    • Classification de documents
    • Extraction de valeurs de clé (pour les reçus, les factures, les permis de conduire et les passeports)
  • Modèles personnalisés pris en charge dans Oracle Analytics
    • Classification de documents personnalisée
    • Extraction de valeurs de clé personnalisées

Vous devez configurer et créer des modèles personnalisés dans la console OCI afin de pouvoir les utiliser dans Oracle Analytics. Tout d'abord, vous utilisez le service d'étiquetage de données pour OCI pour créer un bon jeu de données que vous pouvez utiliser pour entraîner le modèle, puis vous créez votre modèle personnalisé. Voir Service de compréhension de documents pour OCI - Modèles personnalisés.

Exemple de sortie d'un modèle de classification de documents

Dans cet exemple, un flux de données applique un modèle de classification de documents préentraîné aux documents au format JPG afin de prédire s'il s'agit de reçus, et transmet les résultats de l'analyse à un jeu de données. Le jeu de données comprend une valeur REÇU dans la colonne "Type de document", et un niveau de prédiction dans la colonne "Confiance" pour chaque document.


Description de GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png ci-après
.png

Avant de commencer :