Classification de documents

La classification de document peut être utilisée pour classer un document.

Document Understanding fournit une liste des types de documents possibles pour le document analysé. Chaque type de document a un score de confiance. Le score de confiance est un nombre décimal. Les scores plus proches de 1 indiquent une confiance plus élevée dans le texte extrait, tandis que les scores inférieurs indiquent un score de confiance inférieur. La plage du score de confiance pour chaque étiquette est comprise entre 0 et 1. La liste des types de documents possibles est la suivante :
  • Facture
  • Encaissement
  • CV
  • Déclaration de revenus
  • Permis de conduire
  • Passeport
  • relevé bancaire
  • Vérifier
  • Fiche de paie
  • Autre
Les fonctionnalités prises en charge sont les suivantes :
  • Classer un document
  • Score de confiance
  • Demande unique
  • Demande par lots

Exemple de classification de documents

Exemple d'utilisation de la classification des documents dans Document Understanding.

Document d'entrée
Demande d'API Reçu d'un café fictif, comprenant deux lignes, la taxe, le sous-total et les montants totaux. d'entrée de classification de document :
{ 
            "processorConfig": {   
            "processorType": "GENERAL",  
            "features": [    
            {   
            "featureType": "DOCUMENT_CLASSIFICATION",    
            "maxResults": 5   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [  
            {    
            "source": "OBJECT_STORAGE",   
            "namespaceName": "",   
            "bucketName": "",    
            "objectName": ""  
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Sortie :
Réponse d'API :
{ "documentMetadata":
            { "pageCount": 1,
            "mimeType": "image/jpeg" },
            "pages":
            [ { "pageNumber": 1,
            "dimensions": 
            { "width": 361,
            "height": 600,
            "unit": "PIXEL" },
            "detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 },
            { "documentType": "TAX_FORM",
            "confidence": 6.465067e-9 },
            { "documentType": "CHECK",
            "confidence": 6.031838e-9 },
            { "documentType": "BANK_STATEMENT",
            "confidence": 5.413888e-9 },
            { "documentType": "PASSPORT",
            "confidence": 1.5554872e-9 } ],
            ...
            detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 } ], ...