Aperçu du service
Document Understanding est un service colocatif sans serveur que vous pouvez utiliser pour détecter et classer du texte, des tables et d'autres données clés à partir de fichiers de documents que vous téléchargez.
Le service est accessible à l'aide de la console, des API REST, du kit SDK et de l'interface de ligne de commande. Vous pouvez traiter des fichiers ou des lots de documents individuels à l'aide de l'adresse d'API ProcessorJob.
Les modèles préentraînés suivants sont pris en charge :
- Reconnaissance optique des caractères : détecte et reconnaît le texte d'un document.
- Extraction de texte : fournit le texte au niveau du mot et de la ligne, ainsi que les coordonnées de boîte englobante de recherche du texte.
- Extraction clé-valeur : extrait une liste prédéfinie d'informations de paire clé-valeur à partir des reçus, des factures, des passeports et des ID d'inducteur.
- Extraction de table : extrait le contenu sous forme de tableau, en conservant les relations entre les lignes et les colonnes des cellules.
- Classification des documents : classe les documents en différents types en fonction de l'apparence visuelle, des fonctionnalités de haut niveau et des mots-clés extraits. Voici quelques exemples de types de document : facture, réception et CV.
- PDF de reconnaissance optique de caractères (OCR) : génère un fichier PDF recherchable dans le service OCI Object Storage.