Clasificación de Documentos

La clasificación de documentos se puede utilizar para clasificar un documento.

Document Understanding proporciona una lista de posibles tipos de documentos para el documento analizado. Cada tipo de documento tiene una puntuación de confianza. La puntuación de confianza es un número decimal. Las puntuaciones más cercanas a 1 indican una mayor confianza en el texto extraído, mientras que las puntuaciones más bajas indican una menor puntuación de confianza. El rango de la puntuación de confianza para cada etiqueta está entre 0 y 1. La lista de posibles tipos de documento es:
  • Factura
  • Recepción
  • CV
  • Formulario de impuestos
  • Permiso de conducir
  • Pasaporte
  • Extracto bancario
  • Activar
  • Nómina
  • Otro
Las funciones admitidas son:
  • Clasificar documento
  • Puntuación de confianza
  • Solicitud única
  • Solicitud de lote

Ejemplo de Clasificación de Documentos

Ejemplo de uso de clasificación de documentos en Document Understanding.

Documento de Entrada
Solicitud de API de entrada de clasificación de documento Recibo de una cafetería ficticia, que incluye dos artículos de línea, impuestos, importes totales y subtotales.:
{ 
            "processorConfig": {   
            "processorType": "GENERAL",  
            "features": [    
            {   
            "featureType": "DOCUMENT_CLASSIFICATION",    
            "maxResults": 5   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [  
            {    
            "source": "OBJECT_STORAGE",   
            "namespaceName": "",   
            "bucketName": "",    
            "objectName": ""  
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Salida:
Respuesta de API:
{ "documentMetadata":
            { "pageCount": 1,
            "mimeType": "image/jpeg" },
            "pages":
            [ { "pageNumber": 1,
            "dimensions": 
            { "width": 361,
            "height": 600,
            "unit": "PIXEL" },
            "detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 },
            { "documentType": "TAX_FORM",
            "confidence": 6.465067e-9 },
            { "documentType": "CHECK",
            "confidence": 6.031838e-9 },
            { "documentType": "BANK_STATEMENT",
            "confidence": 5.413888e-9 },
            { "documentType": "PASSPORT",
            "confidence": 1.5554872e-9 } ],
            ...
            detectedDocumentTypes":
            [ { "documentType": "RECEIPT",
            "confidence": 1 } ], ...