Classification de documents
La classification de document peut être utilisée pour classer un document.
Le service de compréhension de documents fournit une liste des types de document possibles pour le document analysé. Chaque type de document a une note de confiance. La note de confiance est un nombre décimal. Les notes plus proches de 1 indiquent un niveau de confiance élevé dans le texte extrait, tandis que les notes inférieures indiquent un niveau de confiance inférieur. L'intervalle de la note de confiance pour chaque étiquette est compris entre 0 et 1. La liste des types de document possibles est la suivante :
- Facture
- Encaissement
- CV ou CV
- Formulaire fiscal
- Licence de conducteur
- Passeport
- Relevé bancaire
- Vérification
- Fiche de paie
- Autres
Les fonctions prises en charge sont les suivantes :
- Classer le document
- Note de fiabilité
- Demande unique
- Demande de traitement par lots
Exemple de classification de documents
Exemple d'utilisation de la classification de documents dans le service de compréhension de documents.
- Document d'entrée
-
Demande d'API d'entrée de classification de document
:{ "processorConfig": { "processorType": "GENERAL", "features": [ { "featureType": "DOCUMENT_CLASSIFICATION", "maxResults": 5 } ] }, "inputLocation": { "sourceType": "OBJECT_STORAGE_LOCATIONS", "objectLocations": [ { "source": "OBJECT_STORAGE", "namespaceName": "", "bucketName": "", "objectName": "" } ] }, "compartmentId": "", "outputLocation": { "namespaceName": "", "bucketName": "", "prefix": "" } } - Sortie :
- Réponse d'API :
{ "documentMetadata": { "pageCount": 1, "mimeType": "image/jpeg" }, "pages": [ { "pageNumber": 1, "dimensions": { "width": 361, "height": 600, "unit": "PIXEL" }, "detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 }, { "documentType": "TAX_FORM", "confidence": 6.465067e-9 }, { "documentType": "CHECK", "confidence": 6.031838e-9 }, { "documentType": "BANK_STATEMENT", "confidence": 5.413888e-9 }, { "documentType": "PASSPORT", "confidence": 1.5554872e-9 } ], ... detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 } ], ...