Aperçu du service

Le service de compréhension de documents est un service multilocataire sans serveur que vous pouvez utiliser pour détecter et classer du texte, des tables et d'autres données clés à partir des fichiers de document que vous chargez.

Le service est accessible à l'aide de la console, des API REST, de la trousse SDK et de l'interface de ligne de commande. Vous pouvez traiter des fichiers individuels ou des lots de documents à l'aide du point d'extrémité de l'API ProcessorJob.

Les modèles préentraînés suivants sont pris en charge :

  • Reconnaissance optique de caractères (OCR) : Détecte et reconnaît le texte dans un document.
  • Extraction de texte : Fournit le texte au niveau du mot et de la ligne, ainsi que les coordonnées du rectangle englobant où se trouve le texte.
  • Extraction de valeurs de clé : Extrait une liste prédéfinie d'informations de paire clé-valeur à partir de documents tels que les reçus, les factures, les passeports et les ID inducteurs.
  • Extraction de table : Extrait le contenu sous forme de tableau, en maintenant les relations de rangée et de colonne des cellules.
  • Classification des documents : classe les documents en différents types en fonction de l'apparence visuelle, des fonctions de haut niveau et des mots clés extraits. Par exemple, les types de document sont Facture, Réception et CV.
  • Reconnaissance optique de caractères (OCR) PDF : Génère un fichier PDF interrogeable dans le service de stockage d'objets OCI.