PDF de reconnaissance optique des caractères (ROC)

Le fichier PDF ROC génère un fichier PDF interrogeable dans le stockage d'objets. Par exemple, le service de compréhension de documents peut prendre un fichier PDF avec du texte et des images, et retourner un fichier PDF où vous pouvez rechercher le texte dans le PDF.

Fonctions prises en charge :
  • Générer un PDF interrogeable
  • Demande unique
  • Demande de traitement par lots

Exemple de fichier PDF ROC

Exemple d'utilisation du fichier PDF ROC dans le service de compréhension de documents.

Entrer
Demande d'API Page à partir d'un document PDF d'entrée PDF ROC :
{ 
            "processorConfig": {  
            "processorType": "GENERAL",  
            "features": [   
            {    
            "featureType": "TEXT_EXTRACTION",    
            "generateSearchablePdf": true   
            }  
            ] 
            }, 
            "inputLocation": {  
            "sourceType": "OBJECT_STORAGE_LOCATIONS",  
            "objectLocations": [   
            {    
            "source": "OBJECT_STORAGE",    
            "namespaceName": "",    
            "bucketName": "",    
            "objectName": ""   
            }  
            ] 
            }, 
            "compartmentId": "", 
            "outputLocation": {  
            "namespaceName": "",  
            "bucketName": "",  
            "prefix": "" 
            }
            }
Sortie :
PDF interrogeable;