Classification de documents

La classification de document peut être utilisée pour classer un document.

Le service de compréhension de documents fournit une liste des types de document possibles pour le document analysé. Chaque type de document a une note de confiance. La note de confiance est un nombre décimal. Les notes plus proches de 1 indiquent un niveau de confiance élevé dans le texte extrait, tandis que les notes inférieures indiquent un niveau de confiance inférieur. L'intervalle de la note de confiance pour chaque étiquette est compris entre 0 et 1. La liste des types de document possibles est la suivante :
  • Facture
  • Encaissement
  • CV ou CV
  • Formulaire fiscal
  • Licence de conducteur
  • Passeport
  • Relevé bancaire
  • Vérification
  • Fiche de paie
  • Autres
Les fonctions prises en charge sont les suivantes :
  • Classer le document
  • Note de fiabilité
  • Demande unique
  • Demande de traitement par lots

Exemple de classification de documents

Exemple d'utilisation de la classification de documents dans le service de compréhension de documents.

Document d'entrée
Demande d'API d'entrée de classification de document Réception d'un café fictif, comprenant deux lignes d'article, la taxe, le sous-total et les montants totaux. :
{ 
            "processorConfig": {   
            "processorType": "GENERAL",  
            "features": [    
            {   
            "featureType": "DOCUMENT_CLASSIFICATION",    
            "maxResults": 5   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [  
            {    
            "source": "OBJECT_STORAGE",   
            "namespaceName": "",   
            "bucketName": "",    
            "objectName": ""  
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Sortie :
Réponse d'API :
{ "documentMetadata":
            { "pageCount": 1,
            "mimeType": "image/jpeg" },
            "pages":
            [ { "pageNumber": 1,
            "dimensions": 
            { "width": 361,
            "height": 600,
            "unit": "PIXEL" },
            "detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 },
            { "documentType": "TAX_FORM",
            "confidence": 6.465067e-9 },
            { "documentType": "CHECK",
            "confidence": 6.031838e-9 },
            { "documentType": "BANK_STATEMENT",
            "confidence": 5.413888e-9 },
            { "documentType": "PASSPORT",
            "confidence": 1.5554872e-9 } ],
            ...
            detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 } ], ...