Création d'un jeu de données

Suivez ces étapes pour créer un jeu de données dans le service d'étiquetage de données.

    1. Ouvrez le menu de navigation, et cliquez sur Analyse et intelligence artificielle. Sous apprentissage automatique, cliquez sur Étiquetage de données
    2. Cliquez sur Jeux de données.
    3. Cliquez sur Créer un jeu de données.
    4. Dans la page Ajouter les détails du jeu de données, alimentez les champs comme suit :
      • Nom : Donnez un nom approprié au jeu de données.
      • Description : (Facultatif) Attribuez au jeu de données une description pertinente que vous pouvez utiliser pour faciliter la recherche.
      • Instructions d'étiquetage : (Facultatif) Entrez des instructions et des instructions pour l'équipe qui étiquete les données.
      • Format de jeu de données : Cliquez sur Images, Texte ou Documents, selon que vous voulez marquer des images, des éléments de texte ou des documents.
      • Type de fichier : Si vous sélectionnez Texte comme format du jeu de données, ce champ s'affiche. Sélectionnez TXT ou CSV, selon que vous voulez étiqueter un fichier texte ou un fichier CSV.
      • Classe d'annotation : Sélectionnez comment annoter les images, le texte ou les documents.
        • Étiquettes uniques : Classe les images, le texte ou les documents en une seule classe.
        • Étiquettes multiples : Classe les images, le texte ou les documents en une ou plusieurs classes.
        • Détection d'objet : Pour les images uniquement. Dessine les zones englobantes autour de l'objet dans les images.
        • Extraction d'entités : Pour le texte seulement. Permet de mettre en évidence et d'étiqueter le texte dans une ou plusieurs classes.
        • Valeur de clé : Pour les documents uniquement. Permet d'utiliser la reconnaissance optique de caractères pour identifier et extraire des données dans des documents.
      • Marqueurs : (Facultatif) Pour appliquer des marqueurs au jeu de données, sélectionnez un espace de noms de marqueur (pour les marqueurs définis) et alimentez-le, puis spécifiez une clé et une valeur de marqueur. Ajoutez d'autres marqueurs, si nécessaire. Pour plus d'informations sur le marquage, voir Aperçu du marquage.
      Note

      Le système génère deux marqueurs, CreatedBy et CreatedOn, lorsque vous créez le jeu de données.
    5. Cliquez sur Suivant.
      Dans la page Ajouter des fichiers et des étiquettes, vous spécifiez si vous chargez les fichiers du jeu de données dans le stockage d'objets (allez à l'étape 6) ou si vous utilisez des fichiers qui se trouvent déjà dans le stockage d'objets (ignorez l'étape 7).
    6. Pour charger les fichiers du jeu de données dans le stockage d'objets, cliquez sur Charger des fichiers locaux et procédez comme suit :
      Note

      Vous ne pouvez pas charger plus de 100 fichiers locaux à la fois dans la console. Le nombre de fichiers sélectionnés s'affiche. Pour charger plus de fichiers en une seule fois, chargez-les dans le service de stockage d'objets avant de créer le jeu de données, ou utilisez l'interface de ligne de commande ou la trousse SDK.
      1. Dans l'emplacement du stockage d'objets, spécifiez la destination du stockage d'objets (seau) dans laquelle vous chargez les fichiers locaux :
        • URL du stockage d'objets : Champ en lecture seule déjà alimenté.
        • Compartiment : Sélectionnez le compartiment qui contient le seau.
        • Espace de noms : Alimenté automatiquement en fonction du compartiment sélectionné.
        • Seau : Sélectionnez un seau dans la liste. Si la liste est longue, vous pouvez choisir d'afficher tous les seaux. Si vous cliquez dessus, un panneau s'ouvre et affiche tous les seaux disponibles. Si vous devez créer un seau, cliquez sur le lien dans l'infobulle à côté de l'étiquette Seau, qui vous mène à la page de liste Seaux du service de stockage d'objets. Voir Création d'un seau.
        • (Facultatif) Préfixe : Entrez une chaîne de préfixe ajoutée au début des noms ou des chemins des fichiers.
      2. Si les fichiers à charger sont au format CSV, fournissez les informations suivantes sous Délimiteur :
        • Délimiteur de colonne : Sélectionnez le type de délimiteur pour les colonnes. La virgule est la valeur par défaut. Si vous sélectionnez Personnalisé, entrez le délimiteur dans Délimiteur de colonne personnalisé.
        • Délimiteur de ligne : (Facultatif) Cochez cette case Délimiteur de ligne, puis entrez un délimiteur de ligne dans Délimiteur de ligne personnalisé. Si vous n'entrez pas de valeur, le délimiteur est détecté à partir du fichier CSV.
        • Caractère d'échappement : (Facultatif) Cochez cette case, puis sélectionnez un caractère d'échappement. Si vous choisissez Personnalisé, entrez-le dans le champ Caractère d'échappement personnalisé. Si vous n'entrez pas de valeur, aucun texte n'est échappé.
      3. Sous Fichiers sélectionnés, faites glisser ou sélectionnez les fichiers à charger dans le seau.
        Note

        Tous les fichiers doivent être encodés en UTF-8 et avoir les mêmes en-têtes de colonne et index. Sinon, le jeu de données passe à l'état Attention requise. Voir Formats de fichier pris en charge pour afficher la liste des formats de fichier autorisés.
      4. Sélectionnez un fichier pour afficher un aperçu de son contenu.
        Note

        Seules les cinq premières colonnes et rangées sont affichées dans les fichiers CSV.
      5. (Pour les fichiers CSV.) Pour la colonne à étiqueter, sélectionnez son nom. Si la colonne n'a pas de nom, le numéro d'index s'affiche à la place.
      6. Sous Ajouter des étiquettes, entrez les étiquettes à utiliser pour annoter le jeu de données. Après avoir entré chaque étiquette, appuyez sur Entrée.
      7. Cliquez sur Suivant et passez à l'étape 8.
    7. Pour charger des fichiers qui existent déjà dans un seau de stockage d'objets, cliquez sur Sélectionner dans le stockage d'objets et procédez comme suit :
      1. Dans l'emplacement du stockage d'objets, spécifiez la destination du stockage d'objets (seau) pour alimenter les fichiers à utiliser pour le jeu de données :
        • URL du stockage d'objets : Champ en lecture seule déjà alimenté.
        • Compartiment : Sélectionnez le compartiment qui contient le seau.
        • Espace de noms : Alimenté automatiquement en fonction du compartiment sélectionné.
        • Seau : Sélectionnez un seau dans la liste. Si la liste est longue, vous pouvez choisir d'afficher tous les seaux. Si vous cliquez dessus, un panneau s'ouvre et affiche tous les seaux disponibles. Si vous devez créer un seau, cliquez sur le lien dans l'infobulle à côté de l'étiquette Seau, qui vous mène à la page de liste Seaux du service de stockage d'objets. Voir Création d'un seau.
        • (Facultatif) Préfixe : Entrez une chaîne de préfixe ajoutée au début des noms ou des chemins des fichiers.
        Les fichiers sont répertoriés sous Fichiers sélectionnés. Voir Formats de fichier pris en charge pour afficher la liste des formats de fichier autorisés.
      2. (Facultatif) Si les fichiers sont au format CSV, fournissez les informations suivantes sous Délimiteur :
        • Sélectionnez le délimiteur de colonne : Sélectionnez le type de délimiteur pour les colonnes. La virgule est la valeur par défaut. Si vous choisissez Personnalisé, entrez-le dans le délimiteur de colonne personnalisé.
        • Délimiteur de ligne : (Facultatif) Cochez cette case, puis entrez un délimiteur de ligne dans Délimiteur de ligne personnalisé. Si vous n'entrez pas de valeur, le délimiteur est détecté à partir du fichier CSV.
        • Caractère d'échappement : (Facultatif) Cochez cette case, puis sélectionnez un caractère d'échappement. Si vous sélectionnez Personnalisé, entrez le caractère dans Caractère d'échappement personnalisé. Si vous n'entrez pas de valeur, aucun texte n'est échappé.
      3. Sous Fichiers sélectionnés, sélectionnez un fichier pour afficher un aperçu de son contenu.
        Note

        Seules les cinq premières colonnes et rangées sont affichées pour les fichiers CSV.
      4. (Pour les fichiers CSV uniquement) Pour la colonne à étiqueter, sélectionnez son nom de colonne. Si la colonne n'a pas de nom, le numéro d'index s'affiche à la place.
        Note

        Tous les fichiers doivent être encodés en UTF-8 et avoir les mêmes en-têtes de colonne et index. Sinon, le jeu de données passe à l'état Attention requise. Voir Formats de fichier pris en charge pour afficher la liste des formats de fichier autorisés.
      5. Sous Ajouter des étiquettes, entrez les étiquettes à utiliser pour annoter le jeu de données. Après avoir entré chaque étiquette, appuyez sur Entrée.
      6. Cliquez sur Suivant.
    8. Dans la page Vérifier, vérifiez les informations que vous avez entrées. Si les détails du jeu de données doivent être modifiés, cliquez sur Modifier. Si vous devez revenir en arrière et modifier des valeurs, cliquez sur Modifier.
    9. Pour créer le jeu de données maintenant, cliquez sur Créer.
      Les enregistrements sont générés lors de la création du jeu de données. L'état du jeu de données passe à Mise à jour pendant que les enregistrements sont générés. Ce n'est qu'après la création des enregistrements que les fichiers utilisés apparaissent dans la page des détails du jeu de données.
    10. Pour créer le jeu de données plus tard à l'aide du gestionnaire de ressources et de Terraform, cliquez sur Enregistrer en tant que pile pour enregistrer la définition de ressource en tant que configuration Terraform.
      Pour plus d'informations sur l'enregistrement des piles à partir des définitions de ressource, voir Création d'une pile à partir d'une page de création de ressource.
  • Utilisez la commande create du jeu de données et les paramètres requis pour créer un jeu de données :
    oci data-labeling-service dataset create [OPTIONS]
    Pour la liste complète des indicateurs et des options de variable pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'API.
  • Exécutez l'opération CreateDataset pour créer un jeu de données.