Clasificación de Documentos
La clasificación de documentos se puede utilizar para clasificar un documento.
Document Understanding proporciona una lista de posibles tipos de documentos para el documento analizado. Cada tipo de documento tiene una puntuación de confianza. La puntuación de confianza es un número decimal. Las puntuaciones más cercanas a 1 indican una mayor confianza en el texto extraído, mientras que las puntuaciones más bajas indican una menor puntuación de confianza. El rango de la puntuación de confianza para cada etiqueta está entre 0 y 1. La lista de posibles tipos de documento es:
- Factura
- Recepción
- CV
- Formulario de impuestos
- Permiso de conducir
- Pasaporte
- Extracto bancario
- Activar
- Nómina
- Otro
Las funciones admitidas son:
- Clasificar documento
- Puntuación de confianza
- Solicitud única
- Solicitud de lote
Ejemplo de Clasificación de Documentos
Ejemplo de uso de clasificación de documentos en Document Understanding.
- Documento de Entrada
-
Solicitud de API de entrada de clasificación de documento
:
{ "processorConfig": { "processorType": "GENERAL", "features": [ { "featureType": "DOCUMENT_CLASSIFICATION", "maxResults": 5 } ] }, "inputLocation": { "sourceType": "OBJECT_STORAGE_LOCATIONS", "objectLocations": [ { "source": "OBJECT_STORAGE", "namespaceName": "", "bucketName": "", "objectName": "" } ] }, "compartmentId": "", "outputLocation": { "namespaceName": "", "bucketName": "", "prefix": "" } }
- Salida:
- Respuesta de API:
{ "documentMetadata": { "pageCount": 1, "mimeType": "image/jpeg" }, "pages": [ { "pageNumber": 1, "dimensions": { "width": 361, "height": 600, "unit": "PIXEL" }, "detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 }, { "documentType": "TAX_FORM", "confidence": 6.465067e-9 }, { "documentType": "CHECK", "confidence": 6.031838e-9 }, { "documentType": "BANK_STATEMENT", "confidence": 5.413888e-9 }, { "documentType": "PASSPORT", "confidence": 1.5554872e-9 } ], ... detectedDocumentTypes": [ { "documentType": "RECEIPT", "confidence": 1 } ], ...