Import d'un ensemble de données
Procédez comme suit pour importer un ensemble de données dans Data Labeling.
- Ouvrez le menu de navigation et cliquez sur Analytics et IA. Sous Machine Learning, cliquez sur Data Labeling.
- Cliquez sur Ensembles de données.
- Cliquez sur Importer l'ensemble de données.
- Sur la page Dossier d'import, indiquez si vous téléchargez un dossier local vers Object Storage pour créer un ensemble de données (passez à l'étape 5) ou pour extraire les métadonnées et les enregistrements qui se trouvent déjà dans Object Storage (ignorez l'étape 6).
-
Pour télécharger des fichiers vers Object Storage à partir d'un dossier local, cliquez sur Télécharger le dossier local et procédez comme suit :
- Cliquez sur Sélectionner un dossier pour sélectionner un dossier dans le gestionnaire de fichiers contenant les fichiers de jeu de données. Remarque
Dans certains formats, l'ensemble de données contient un fichier de métadonnées et des fichiers d'enregistrement. Les fichiers d'enregistrement peuvent se trouver dans un sous-dossier ou dans le même dossier que le fichier de métadonnées. - Sélectionnez le dossier et cliquez sur Charger. Le nom et le chemin du dossier de métadonnées sont détectés et affichés sous Dossier sélectionné. Cliquez sur Modifier pour modifier le choix du dossier et sur Supprimer pour supprimer le choix.
- Sous Object_Storage location, indiquez le bucket Object Storage dans lequel charger les fichiers locaux :
- URL Object Storage : champ en lecture seule, déjà rempli.
- Compartiment : sélectionnez le compartiment qui contient le bucket.
- Espace de noms : rempli automatiquement en fonction du compartiment sélectionné.
- Bucket : sélectionnez un bucket dans la liste. Si la liste est longue, vous pouvez choisir d'afficher tous les buckets. Si vous cliquez dessus, un panneau répertoriant tous les buckets disponibles est affiché. Si vous devez créer un bucket, cliquez sur le lien dans l'info-bulle en regard du libellé Bucket. Vous accédez alors à la page de liste Buckets dans le service Object Storage. Reportez-vous à Création d'un bucket.
- (Facultatif) Préfixe : saisissez une chaîne de préfixe à ajouter au début des noms ou des chemins des fichiers.
- Cliquez sur Suivant et passez à l'étape 7.
- Cliquez sur Sélectionner un dossier pour sélectionner un dossier dans le gestionnaire de fichiers contenant les fichiers de jeu de données.
-
Pour extraire les métadonnées et les enregistrements qui se trouvent déjà dans Object Storage, cliquez sur Sélectionner à partir d'Object Storage et procédez comme suit :
- Dans Emplacement Object Storage, entrez l'URL du fichier de métadonnées dans Object Storage à charger, au format suivant :
https://objectstorage.<region-identifer>.oraclecloud.com/n/<namespace>/b/<bucket>/o/<object>
. Vous pouvez trouver cette URL sur la page de détails du bucket comme suit :- Accédez au bucket contenant le fichier.
- Sous Objets, cliquez sur le dossier contenant le fichier de métadonnées de l'ensemble de données.
- Recherchez le fichier de métadonnées.
- Dans le menu Action du fichier de métadonnées, sélectionnez Visualiser les détails d'objet.
- Copiez la valeur de Chemin d'URL (URI).
- Collez-le dans l'URL Object Storage.
- Si les fichiers d'enregistrement se trouvent dans un répertoire différent de celui du fichier de métadonnées, sous Emplacement du fichier, désélectionnez la case Un enregistrement est présent dans le même chemin de métadonnées et fournissez les informations suivantes :
- URL Object Storage : champ en lecture seule, déjà rempli.
- Compartiment : sélectionnez le compartiment qui contient le bucket.
- Espace de noms : rempli automatiquement en fonction du compartiment sélectionné.
- Bucket : sélectionnez un bucket dans la liste. Si la liste est longue, vous pouvez choisir d'afficher tous les buckets. Si vous cliquez dessus, un panneau répertoriant tous les buckets disponibles est affiché.
- (Facultatif) Préfixe : saisissez une chaîne de préfixe à ajouter au début des noms ou des chemins des fichiers.
- Cliquez sur Suivant.
- Dans Emplacement Object Storage, entrez l'URL du fichier de métadonnées dans Object Storage à charger, au format suivant :
-
Sur la page Ajouter des détails de jeu de données, les champs sont renseignés à partir du fichier de métadonnées, mais vous pouvez renseigner tous les champs si nécessaire :
- Nom : attribuez un nom approprié à l'ensemble de données.
- Description : (facultatif) donnez à l'ensemble de données une description pertinente que vous pourrez utiliser pour le rechercher.
- Instructions d'étiquetage : (facultatif) entrez les instructions et les instructions de l'équipe qui étiquete les données.
- Format d'ensemble de données : cliquez sur images, texte ou documents, selon que vous souhaitez libeller des images, des textes ou des documents.
- Format d'import : sélectionnez le format de l'ensemble de données. Par exemple, COCO ou YOLO v5.
- Classe d'annotation : sélectionnez le mode d'annotation des images, du texte ou des documents.
- Libellés uniques : classe les images, le texte ou les documents en une seule classe.
- Libellés multiples : classe les images, le texte ou les documents en classes.
- Détection d'objet : pour les images uniquement. Dessine des boîtes englobantes autour de l'objet dans les images.
- Extraction d'entité : pour le texte uniquement. Met le texte en évidence et le nomme dans des classes.
- Valeur clé : pour les documents uniquement. Utilise la reconnaissance optique des caractères (OCR) de Document Understanding pour identifier et extraire des informations à partir de documents.
- Libellés : entrez les libellés à utiliser avec l'ensemble de données. Une fois le libellé saisi, appuyez sur Entrée.
- Cliquez sur Suivant.
- Sur la page Vérifier, vérifiez les informations que vous avez entrées. Si les détails de l'ensemble de données doivent être modifiés, cliquez sur Modifier. Si vous devez revenir en arrière et modifier des valeurs, cliquez sur Modifier.
-
Cliquez sur Import.
Les enregistrements sont générés lors de l'importation du jeu de données. L'ensemble de données passe à l'état
Updating
pendant la génération des enregistrements. Une fois les enregistrements créés, les fichiers utilisés apparaissent sur la page de détails de l'ensemble de données.Remarque
Si vous avez indiqué un format incorrect, l'import échoue avec un message d'erreur. Cliquez sur Réessayer l'import dans le message d'erreur pour afficher la boîte de dialogue Réessayer l'import. Ici, vous pouvez mettre à jour l'URL de métadonnées ou le format d'import, le cas échéant, et cliquer sur Réessayer pour réessayer l'import. -
Pour importer l'ensemble de données ultérieurement à l'aide de Resource Manager et de Terraform, cliquez sur Enregistrer en tant que pile pour enregistrer la définition de ressource en tant que configuration Terraform.
Pour plus d'informations sur l'enregistrement de piles à partir de définitions de ressource, reportez-vous à Création d'une pile à partir d'une page de création de ressource.
Utilisez la commande import-pre-annotated-data et les paramètres requis pour importer des enregistrements et des annotations à partir de fichiers de jeu de données dans un jeu de données :
Utilisez la commande import-pre-annotated-data-object-storage-import-metadata-path et les paramètres requis pour importer des enregistrements et des annotations à partir de fichiers de jeu de données dans le stockage d'objets dans un jeu de données :oci data-labeling-service dataset import-pre-annotated [OPTIONS]
oci data-labeling-service dataset import-pre-annotated-data-object-storage-import-metadata-path [OPTIONS]
Afin d'obtenir la liste complète des indicateurs et des options de variable pour les commandes d'interface de ligne de commande, reportez-vous à Référence de commande d'interface de ligne de commande.
Cette tâche n'est pas disponible dans l'API.