Utilisation d'un modèle préentraîné dans la console

Vision fournit des modèles préentraînés pour extraire des informations des images, sans avoir besoin de spécialistes des données.

Ce tutoriel explique comment :

Avant de commencer

Avant d'utiliser le service de visualisation, l'administrateur de votre location doit configurer les politiques appropriées.

Configuration des politiques

Suivez ces étapes pour configurer les politiques requises pour utiliser Vision.

  1. Dans le menu de navigation de la console, sélectionnez Identité et sécurité.
  2. Sous identité, sélectionnez Politiques.
  3. Sélectionnez Créer une politique.
    Le panneau Créer une politique est affiché.
  4. Entrer un nom. Vous ne pouvez utiliser que des caractères alphanumériques, des traits d'union, des points et des traits de soulignement. Les espaces ne sont pas autorisés. Par exemple, entrez vision-access-policy.
  5. Entrez une description pour aider les autres utilisateurs à connaître la fonction de ce jeu de politiques. Par exemple, entrez Policy to access Vision service..
  6. Sélectionnez le compartiment.
  7. Dans le générateur de politiques, sélectionnez Afficher l'éditeur manuel.
  8. Ajoutez l'instruction suivante :
    allow any-user to use ai-service-vision-family in tenancy
  9. (Facultatif) Pour limiter l'accès à votre groupe d'utilisateurs uniquement, ajoutez plutôt la politique suivante :
    allow group <your-group-name> to use ai-service-vision-family in tenancy
  10. Sélectionnez Créer.

1. Comprendre les exigences liées aux données

Vision fonctionne avec de nombreux formats de données d'image pour détecter des objets, affecter des étiquettes à des images, extraire du texte, etc. Elle accepte les données au moyen du service de stockage d'objets. Si Vision est exécuté dans la console, vous pouvez également fournir des images stockées localement.

Vision offre des API synchrones et asynchrones pour analyser les images. Les exigences en matière de données sont expliquées dans le tableau suivant :
Exigences en matière de données d'API
API Description Format d'entrée pris en charge
API synchrone
  • analyzeImage
  • analyzeDocument
Analyse les images individuelles.
  • JPG, PNG. Les formats PDF et TIFF sont également pris en charge par analyzeDocument
  • Jusqu'à 5 Mo
  • Entrée d'image unique
API asynchrone Analysez plusieurs images ou fichiers PDF de plusieurs pages.
  • JPG, PNG. Les formats PDF et TIFF sont également pris en charge par analyzeDocument
  • Prend en charge le PDF multi-page
  • Jusqu'à 2 000 images saisies

2. Charger les données dans le stockage d'objets

Cette étape consiste à charger dans le stockage d'objets les images et les documents à analyser.

Remplissez 1. Comprendre les exigences en matière de données avant d'essayer cette section.

Créez un compartiment de stockage d'objets

Si vous avez déjà un seau dans le stockage d'objets que vous pouvez utiliser, allez directement à la section suivante sur le chargement des fichiers d'image.

  1. Dans le menu de navigation de la console, sélectionnez Stockage.
  2. Sous Stockage d'objets, sélectionnez Seaux.
  3. Dans la page Seaux, sous Portée de la liste, sélectionnez votre compartiment.
  4. Sélectionnez Créer un seau. Le volet Créer un seau s'affiche.
  5. Entrez un nom de seau. N'entrez pas d'informations confidentielles.
  6. Sous Niveau de stockage par défaut, sélectionnez Standard. Laissez tous les autres champs à leur valeur par défaut.
  7. Sélectionnez Créer.

Charger les fichiers d'image dans le seau de stockage d'objets

  1. Dans la page Seaux, sélectionnez le nom du seau dans lequel vous allez charger des images. La page des détails du seau s'affiche.
  2. Sous Ressources, sélectionnez Objets pour afficher la liste des objets du seau.
  3. Sélectionnez Charger. Le panneau Charger des objets s'affiche.
  4. Faites glisser les fichiers à charger dans le panneau, ou sélectionnez Sélectionner des fichiers pour les sélectionner dans vos fichiers locaux.

3. Intelligence artificielle pour les documents

Étapes d'utilisation des fonctions d'intelligence artificielle pour documents dans Vision.

Remplissez 2. Charger des données dans le stockage d'objets avant d'essayer cette section.

Ouvrir la console Vision

  1. Dans le menu de navigation de la console, sélectionnez Analyse et intelligence artificielle.
  2. Sous Services d'intelligence artificielle, cliquez sur Vision. La page d'accueil Vision s'affiche.

Utiliser l'intelligence artificielle pour les documents

  1. Sous Vision, sélectionnez Intelligence artificielle pour les documents. La page Document AI s'affiche.
  2. Sous Source de l'image, sélectionnez Stockage d'objets.
  3. Sélectionnez un document que vous avez chargé dans 2. Charger des données dans le stockage d'objets. L'API analyzeDocument est appelée.
Ces fonctions sont appelées et les résultats affichés dans la console :
Résultats de l'IA de documents
Fonction Description Résultats
ROC (reconnaissance optique de caractères) Permet de rechercher et de numériser les informations textuelles des images. Le texte identifié dans le document est affiché sous Texte brut dans le volet Résultats.
Classification d'image de document Classe les documents en différents types en fonction de leur aspect visuel, de leurs caractéristiques générales et de leurs mots clés extraits. La classification dans un type de document avec une note de confiance s'affiche dans le volet Résultats.
Classification de langue Classe la langue du document en fonction des fonctions visuelles. La classification dans une langue de document avec une note de confiance s'affiche dans le volet Résultats.
Extraction de tableaux Extrait le contenu dans un format tabulaire, en maintenant les relations de rangée et de colonne des cellules. Dans le volet Résultats, cliquez sur l'onglet Table pour voir la sortie.
Sortie PDF consultable Intègre une couche transparente au-dessus de l'image d'un document dans le format PDF pour le rendre interrogeable par mots clés.

Note : Cette fonctionnalité n'est disponible que lorsqu'un document PDF est fourni.

Cliquez sur PDF interrogeable. Un fichier PDF ROC est téléchargé sur votre ordinateur.

4. Analyse d'image

Étapes d'utilisation des fonctions d'analyse d'image dans Vision.

Remplissez 2. Charger des données dans le stockage d'objets avant d'essayer cette section.

Ouvrir la console Vision

  1. Dans le menu de navigation de la console, sélectionnez Analyse et intelligence artificielle.
  2. Sous Services d'intelligence artificielle, sélectionnez Vision. La page d'accueil Vision s'affiche.

Utiliser la classification d'image

  1. Sous Vision, sélectionnez Classification d'image. La page Image Classification s'affiche.
  2. Sélectionnez Stockage d'objets.
  3. Sélectionnez une image que vous avez chargée dans 2. Charger des données dans le stockage d'objets. L'API analyzeIamge est appelée.

Les résultats catégorisant les objets dans l'image sont affichés dans la section Résultats. Il existe des étiquettes pour classer les objets détectés et une note de confiance pour chaque objet.

Utiliser la détection d'objets

  1. Sous Vision, sélectionnez Détection d'objet. La page Object Detection s'affiche.
  2. Sélectionnez Stockage d'objets.
  3. Sélectionnez une image que vous avez chargée dans 2. Charger des données dans le stockage d'objets. L'API analyzeIamge est appelée.

Les résultats sont affichés dans la section Résultats. Les objets détectés, une note de confiance pour chaque objet et une zone englobante en surbrillance autour de chaque objet sont affichés dans le volet Résultats. Si vous cliquez sur une étiquette, l'emplacement sur l'image où l'objet est détecté s'affiche.

Étape suivante

Maintenant que vous savez comment utiliser Vision avec des modèles préentraînés, essayez de l'utiliser avec des modèles personnalisés.