Riconoscimento ottico caratteri (OCR) - PDF

OCR PDF genera un file PDF ricercabile nello storage degli oggetti. Ad esempio, Document Understanding può acquisire un file PDF con testo e immagini e restituire un file PDF in cui è possibile cercare il testo nel PDF.

Funzioni supportate:
  • Genera PDF ricercabile
  • Richiesta singola
  • Richiesta batch

Esempio PDF OCR

Esempio di utilizzo del PDF OCR in Document Understanding.

Input
Richiesta API input PDF OCR Pagina da un documento PDF:
{ 
            "processorConfig": {  
            "processorType": "GENERAL",  
            "features": [   
            {    
            "featureType": "TEXT_EXTRACTION",    
            "generateSearchablePdf": true   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [   
            {    
            "source": "OBJECT_STORAGE",    
            "namespaceName": "",    
            "bucketName": "",    
            "objectName": ""   
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
output:
PDF ricercabile.