PDF de reconhecimento de caracteres ópticos (OCR)

O OCR PDF gera um arquivo PDF pesquisável no Object Storage. Por exemplo, o Document Understanding pode pegar um arquivo PDF com texto e imagens e retornar um arquivo PDF onde você pode procurar o texto no PDF.

Recursos suportados:
  • Gerar PDF pesquisável
  • Solicitação única
  • Solicitação em lote

Exemplo de PDF OCR

Um exemplo de uso do OCR PDF no Document Understanding.

Entrada
OCR PDF Entrada Página de um documento PDF Solicitação de API:
{ 
            "processorConfig": {  
            "processorType": "GENERAL",  
            "features": [   
            {    
            "featureType": "TEXT_EXTRACTION",    
            "generateSearchablePdf": true   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [   
            {    
            "source": "OBJECT_STORAGE",    
            "namespaceName": "",    
            "bucketName": "",    
            "objectName": ""   
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Saída:
PDF Pesquisável.