Reconnaissance optique de caractères (OCR) PDF

OCR PDF génère un fichier PDF recherchable dans Object Storage. Par exemple, Document Understanding peut prendre un fichier PDF avec du texte et des images et renvoyer un fichier PDF dans lequel vous pouvez rechercher le texte dans le fichier PDF.

Fonctions prises en charge :
  • Générer un PDF pouvant faire l'objet d'une recherche
  • Demande unique
  • Demande par lots

Exemple PDF ROC

Exemple d'utilisation d'OCR PDF dans Document Understanding.

Entrée
Demande d'API Page d'un document PDF d'entrée PDF OCR :
{ 
            "processorConfig": {  
            "processorType": "GENERAL",  
            "features": [   
            {    
            "featureType": "TEXT_EXTRACTION",    
            "generateSearchablePdf": true   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [   
            {    
            "source": "OBJECT_STORAGE",    
            "namespaceName": "",    
            "bucketName": "",    
            "objectName": ""   
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Sortie :
PDF pouvant faire l'objet d'une recherche.