Aperçu du service

Document Understanding est un service colocatif sans serveur que vous pouvez utiliser pour détecter et classer du texte, des tables et d'autres données clés à partir de fichiers de documents que vous téléchargez.

Le service est accessible à l'aide de la console, des API REST, du kit SDK et de l'interface de ligne de commande. Vous pouvez traiter des fichiers ou des lots de documents individuels à l'aide de l'adresse d'API ProcessorJob.

Les modèles préentraînés suivants sont pris en charge :

Reconnaissance optique des caractères : détecte et reconnaît le texte d'un document.
Extraction de texte : fournit le texte au niveau du mot et de la ligne, ainsi que les coordonnées de boîte englobante de recherche du texte.
Extraction de la valeur de clé : extrait une liste prédéfinie d'informations de paire clé-valeur à partir de documents tels que les reçus, les factures, les passeports et les ID d'inducteur.
Extraction de table : extrait le contenu sous forme de tableau, en conservant les relations entre les lignes et les colonnes des cellules.
Classification des documents : classe les documents en différents types en fonction de l'apparence visuelle, des fonctionnalités de haut niveau et des mots-clés extraits. Voici quelques exemples de types de document : facture, réception et CV.
PDF de reconnaissance optique de caractères (OCR) : génère un fichier PDF recherchable dans le service OCI Object Storage.

Documentation Oracle Cloud Infrastructure

Aperçu du service