PDF de reconocimiento óptico de caracteres (OCR)

OCR PDF genera un archivo PDF con capacidad de búsqueda en Object Storage. Por ejemplo, Document Understanding puede tomar un archivo PDF con texto e imágenes, y devolver un archivo PDF donde puede buscar el texto en el PDF.

Funciones Soportadas:
  • Generar PDF apto para búsqueda
  • Solicitud única
  • Solicitud de lote

Ejemplo de PDF de OCR

Ejemplo de uso de PDF de OCR en Document Understanding.

Entrada
Solicitud de API de entrada PDF de OCR Página de un documento PDF:
{ 
            "processorConfig": {  
            "processorType": "GENERAL",  
            "features": [   
            {    
            "featureType": "TEXT_EXTRACTION",    
            "generateSearchablePdf": true   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [   
            {    
            "source": "OBJECT_STORAGE",    
            "namespaceName": "",    
            "bucketName": "",    
            "objectName": ""   
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Salida:
PDF apto para búsqueda.