Importazione di un data set
Attenersi alla procedura riportata di seguito per importare un data set in Etichettatura dati.
- Aprire il menu di navigazione e fare clic su Analytics e AI. In Machine Learning, fare clic su Etichettatura dati.
- Fare clic su Data set.
- Fare clic su Importa data set.
- Nella pagina Importa cartella è possibile specificare se caricare una cartella locale nello storage degli oggetti per creare un data set (andare al passo 5) o recuperare i metadati e i record già presenti nello storage degli oggetti (passare al passo 6).
-
Per caricare i file: da una cartella locale allo storage degli oggetti, fare clic su Carica cartella locale e attenersi alla procedura riportata di seguito.
- Fare clic su Selezionare una cartella per selezionare una cartella dal file manager contenente i file del set di dati. Nota
In alcuni formati, il data set contiene un file di metadati e file di record. I file di record potrebbero trovarsi in una sottocartella o nella stessa cartella del file di metadati. - Selezionare la cartella e fare clic su Carica. Il nome e il percorso della cartella del file di metadati vengono rilevati e visualizzati in Cartella selezionata. Fare clic su Modifica per modificare la scelta della cartella e su Elimina per eliminare la scelta.
- In Object_Storage posizione, specificare il bucket di storage degli oggetti in cui si desidera caricare i file locali:
- URL storage degli oggetti: campo di sola lettura già popolato.
- Compartimento: selezionare il compartimento contenente il bucket.
- Spazio di nomi: popolato automaticamente in base al compartimento selezionato.
- Bucket: selezionare un bucket dalla lista. Se l'elenco è lungo, è possibile scegliere di visualizzare tutti i bucket. Se si fa clic su di esso, viene visualizzato un pannello in cui sono elencati tutti i bucket disponibili. Se è necessario creare un bucket, fare clic sul collegamento nel suggerimento accanto all'etichetta Bucket, che consente di accedere alla pagina della lista Bucket nel servizio di storage degli oggetti. Vedere Creazione di un gruppo.
- (Facoltativo) Prefisso: immettere una stringa di prefisso da aggiungere all'inizio dei nomi o dei percorsi dei file.
- Fare clic su Successivo e andare al passo 7.
- Fare clic su Selezionare una cartella per selezionare una cartella dal file manager contenente i file del set di dati.
-
Per recuperare i metadati e i record già presenti nello storage degli oggetti, fare clic su Seleziona dallo storage degli oggetti e attenersi alla procedura riportata di seguito.
- Nella posizione dello storage degli oggetti, immettere l'URL del file di metadati nello storage degli oggetti che si desidera caricare nel formato:
https://objectstorage.<region-identifer>.oraclecloud.com/n/<namespace>/b/<bucket>/o/<object>
. È possibile trovare questo URL nella pagina dei dettagli del bucket come indicato di seguito.- Vai al bucket che contiene il file.
- In Oggetti fare clic sulla cartella che contiene il file di metadati del data set.
- Trovare il file di metadati.
- Dal menu Azione per il file di metadati, selezionare Visualizza dettagli oggetto.
- Copiare il valore per Percorso URL (URI).
- Incollalo in URL storage degli oggetti.
- Se i file di record si trovano in una directory diversa da quella del file di metadati, in Posizione file deselezionare la casella di controllo Un record è presente nello stesso percorso di metadati e fornire le informazioni riportate di seguito.
- URL storage degli oggetti: campo di sola lettura già popolato.
- Compartimento: selezionare il compartimento contenente il bucket.
- Spazio di nomi: popolato automaticamente in base al compartimento selezionato.
- Bucket: selezionare un bucket dalla lista. Se l'elenco è lungo, è possibile scegliere di visualizzare tutti i bucket. Se si fa clic su di esso, viene visualizzato un pannello in cui sono elencati tutti i bucket disponibili.
- (Facoltativo) Prefisso: immettere una stringa di prefisso da aggiungere all'inizio dei nomi o dei percorsi dei file.
- Fare clic su Successivo.
- Nella posizione dello storage degli oggetti, immettere l'URL del file di metadati nello storage degli oggetti che si desidera caricare nel formato:
-
Nella pagina Aggiungi dettagli set di dati, i campi vengono popolati dal file di metadati, ma è possibile popolare i campi in base alle esigenze.
- Nome: assegnare al data set un nome appropriato.
- Descrizione: (facoltativo) fornire al set di dati una descrizione pertinente che può essere utilizzata per facilitare la ricerca.
- Istruzioni di etichettatura: (facoltativo) immettere le istruzioni e le indicazioni per il team che assegna l'etichetta ai dati.
- Formato data set: fare clic su Immagini, Testo o Documenti, a seconda che si desideri etichettare immagini, parti di testo o documenti.
- Formato di importazione: selezionare il formato del data set. Ad esempio COCO o YOLO v5.
- Classe di annotazione: selezionare la modalità di annotazione di immagini, testo o documenti.
- Etichette singole: suddivide in categorie immagini, testo o documenti in un'unica classe.
- Etichette multiple: suddivide in categorie immagini, testo o documenti in una o più classi.
- Rilevamento oggetti: solo per le immagini. Disegna riquadri intorno all'oggetto nelle immagini.
- Estrazione entità: solo per testo. Consente di evidenziare ed etichettare il testo in una o più classi.
- Valore chiave: solo per documenti. Utilizza l'OCR di Document Understanding per identificare ed estrarre informazioni dai documenti.
- Etichette: immettere le etichette da utilizzare con il data set. Dopo avere immesso ogni etichetta, premere Invio.
- Fare clic su Successivo.
- Nella pagina Rivedi, verificare le informazioni inserite. Se è necessario modificare i dettagli del data set, fare clic su Modifica. Se è necessario tornare indietro e modificare qualsiasi valore, fare clic su Modifica.
-
Fare clic su Importa.
I record vengono generati quando il set di dati viene importato. Lo stato del set di dati viene modificato in
Updating
durante la generazione dei record. Solo dopo aver creato i record, i file utilizzati vengono visualizzati nella pagina dei dettagli del data set.Nota
Se è stato specificato un formato errato, l'importazione non riesce con un messaggio di errore. Fare clic su Riprova importazione nel messaggio di errore per visualizzare la finestra di dialogo Riprova importazione. Qui è possibile aggiornare l'URL metadati o il formato di importazione in base alle esigenze e fare clic su Riprova per riprovare a eseguire l'importazione. -
Per importare il data set in un secondo momento utilizzando Resource Manager e Terraform, fare clic su Salva come stack per salvare la definizione della risorsa come configurazione Terraform.
Per informazioni sul salvataggio degli stack dalle definizioni delle risorse, vedere Creazione di uno stack da una pagina di creazione delle risorse.
Utilizzare il comando import-pre-annotated-data e i parametri richiesti per importare record e annotazioni da file di set di dati in un set di dati:
Utilizzare il comando import-pre-annotated-data-object-storage-import-metadata-path e i parametri necessari per importare record e annotazioni dai file dei data set nello storage degli oggetti in un data set:oci data-labeling-service dataset import-pre-annotated [OPTIONS]
oci data-labeling-service dataset import-pre-annotated-data-object-storage-import-metadata-path [OPTIONS]
Per un elenco completo dei flag e delle opzioni variabili per i comandi CLI, consultare il manuale CLI Command Reference.
Task non disponibile nell'interfaccia API.