Présentation de la classification de documents et de l'extraction de valeur de clé

Dans Oracle Cloud Infrastructure (OCI), Document Understanding fournit des modèles d'IA préentraînés qui peuvent extraire du texte, des tables et d'autres données de clé à partir de fichiers de document. Effectuez une classification de documents ou une extraction de valeur de clé sur un document, puis utilisez les données extraites dans le cadre de votre analyse dans Oracle Analytics.

Document Understanding permet également de créer des modèles personnalisés à des fins d'extraction de valeur de clé et de classification de documents.

Dans Oracle Analytics, les flux de données permettent d'appliquer les modèles d'IA Document Understanding à vos données.

Oracle Analytics prend en charge plusieurs modèles d'IA Document Understanding préentraînés et personnalisés :
  • Modèles préentraînés pris en charge dans Oracle Analytics
    • Classification de documents
    • Extraction de valeur de clé (pour les reçus, les factures, les permis de conduire et les passeports)
  • Modèles personnalisés pris en charge dans Oracle Analytics
    • Classification de documents personnalisée
    • Extraction de valeur de clé personnalisée

Vous devez créer et configurer des modèles personnalisés dans la console OCI pour pouvoir les utiliser dans Oracle Analytics. A l'aide d'OCI Data Labeling, créez d'abord un ensemble de données de qualité que vous pourrez utiliser pour entraîner le modèle, puis créez le modèle personnalisé. Reportez-vous à OCI Document Understanding - Modèles personnalisés.

Exemple de sortie d'un modèle de classification de documents

Dans cet exemple, un flux de données applique un modèle de classification de documents préentraîné à des documents au format JPG pour déterminer s'il s'agit de reçus et affiche les résultats de l'analyse dans un ensemble de données. L'ensemble de données comprend une valeur RECEIPT pour "Document Type", et un niveau de prévision "Confidence" pour chaque document.


La description de GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png est la suivante
.png

Avant de commencer :