À propos du service d'étiquetage de données

Découvrez le service d'étiquetage de données, ce qu'il regroupe et comment l'utiliser.

L'étiquetage de données consiste à identifier les propriétés (étiquettes) de documents, de textes et d'images (enregistrements), et à les ajouter en tant qu'annotations à ces éléments. Exemples d'étiquettes : le sujet d'un article, le sentiment d'un gazouillis, la légende d'une image, les mots importants prononcés dans un enregistrement audio ou le genre d'une vidéo.

De nombreuses techniques d’apprentissage automatique nécessitent des données étiquetées pour entraîner les machines à effectuer une tâche en mode autonome. L'étiquetage de données fait donc partie intégrante d'un projet d'intelligence artificielle (IA) ou d'apprentissage automatique (ML).

Le service Étiquetage de données permet de créer et d'explorer des jeux de données, de voir des enregistrements de données (documents, textes et images) et d'appliquer des étiquettes afin de créer des modèles pour l'intelligence artificielle et l'apprentissage automatique. Les jeux de données peuvent être exportés en tant que JSON délimité par des lignes pour être utilisés dans le développement de modèles d'apprentissage automatique. Les jeux de données sont accessibles et interopérables entre d’autres services de données et d’IA pour prendre en charge l'entraînement supervisé. Par exemple, le langage Oracle Cloud Infrastructure peut être utilisé pour créer des modèles spécialisés, mais seulement si des données étiquetées sont disponibles pour l'entraînement du modèle. Le service Étiquetage de données vous permet de commencer rapidement à étiqueter des jeux de données bruts avec un nombre minimal d'étapes de configuration. Ainsi, il fournit également l'expérience d'étiquetage de données pour les services d'intelligence artificielle d'Oracle Cloud Infrastructure.

Les informations sur les types de fichier et les types de contenu pris en charge pour les documents, le texte et les images sont fournies dans les formats de fichier pris en charge.

Les jeux de données sont les ressources de base disponibles dans le service Étiquetage de données. Ils sont constitués d'enregistrements de données et des étiquettes qui leur sont associées. Les enregistrements de données représentent un document, une image unique ou un morceau de texte. Les étiquettes sont des chaînes de texte qui deviennent des annotations lorsqu'elles sont associées à un enregistrement de données. Les annotations sont associées à d'autres données, par exemple, dans le cas de la détection d'objet, aux coordonnées du rectangle englobant. Les enregistrements de données peuvent exister sans annotation. Les jeux de données peuvent être exportés sous forme de manifeste JSON à utiliser comme entrée pour le développement de modèles d'apprentissage automatique.
Conseil

Regardez une vidéo de présentation du service..
Pour utiliser le service Étiquetage de données :
  1. Configurez-le, notamment la création de seaux dans le service Stockage d'objets et la configuration de vos politiques d'utilisateur.
  2. Créer un jeu de données.
  3. Générez des enregistrements dans votre jeu de données.
  4. Ajoutez des étiquettes à vos documents, images ou à des éléments de texte.
  5. Exportez le jeu de données vers le service Stockage d'objets pour l'utiliser ailleurs.