Creazione di un data set
Attenersi alla procedura riportata di seguito per creare un data set in Etichettatura dati.
- Aprire il menu di navigazione e fare clic su Analytics e AI. In Machine Learning, fare clic su Etichettatura dati
- Fare clic su Data set.
- Fare clic su Crea data set.
-
Nella pagina Aggiungi dettagli set di dati popolare i campi come indicato di seguito.
- Nome: assegnare al data set un nome appropriato.
- Descrizione: (facoltativo) fornire al set di dati una descrizione pertinente che può essere utilizzata per facilitare la ricerca.
- Istruzioni di etichettatura: (facoltativo) immettere le istruzioni e le indicazioni per il team che assegna l'etichetta ai dati.
- Formato data set: fare clic su Immagini, Testo o Documenti, a seconda che si desideri etichettare immagini, parti di testo o documenti.
- Tipo di file: se si seleziona Testo come formato del set di dati, questo campo viene visualizzato. Selezionare
TXT
oCSV
, a seconda che si desideri etichettare un file di testo o un file CSV. - Classe di annotazione: selezionare la modalità di annotazione di immagini, testo o documenti.
- Etichette singole: suddivide in categorie immagini, testo o documenti in un'unica classe.
- Etichette multiple: suddivide in categorie immagini, testo o documenti in una o più classi.
- Rilevamento oggetti: solo per le immagini. Disegna riquadri intorno all'oggetto nelle immagini.
- Estrazione entità: solo per testo. Consente di evidenziare ed etichettare il testo in una o più classi.
- Valore chiave: solo per documenti. Utilizza l'OCR di Document Understanding per identificare ed estrarre informazioni dai documenti.
- Tag: (facoltativo) per applicare tag al data set, selezionare uno spazio di nomi tag (per le tag definite) e inserire i dati desiderati, quindi specificare chiave e valore di tag. Aggiungere altre tag in base alle esigenze. Per ulteriori informazioni sull'applicazione di tag, vedere Panoramica sull'applicazione di tag.
Nota
Quando si crea il set di dati, il sistema genera due tag CreatedBy e CreatedOn. -
Fare clic su Successivo.
Nella pagina Aggiungi file ed etichette è possibile specificare se caricare i file per il data set nello storage degli oggetti (andare al passo 6) o utilizzare i file già presenti nello storage degli oggetti (passare al passo 7).
-
Per caricare i file per il data set nello storage degli oggetti, fare clic su Carica file locali e attenersi alla procedura riportata di seguito.
Nota
Nella console non è possibile caricare più di 100 file locali alla volta. Viene visualizzato il numero di file selezionati. Per caricare più file alla volta, caricarli nello storage degli oggetti prima di creare il data set oppure utilizzare l'interfaccia CLI o l'SDK.- Nella posizione dello storage degli oggetti, specificare la destinazione dello storage degli oggetti (bucket) in cui caricare i file locali:
- URL storage degli oggetti: campo di sola lettura già popolato.
- Compartimento: selezionare il compartimento contenente il bucket.
- Spazio di nomi: popolato automaticamente in base al compartimento selezionato.
- Bucket: selezionare un bucket dalla lista. Se l'elenco è lungo, è possibile scegliere di visualizzare tutti i bucket. Se si fa clic su di esso, viene visualizzato un pannello in cui sono elencati tutti i bucket disponibili. Se è necessario creare un bucket, fare clic sul collegamento nel suggerimento accanto all'etichetta Bucket, che consente di accedere alla pagina della lista Bucket nel servizio di storage degli oggetti. Vedere Creazione di un gruppo.
- (Facoltativo) Prefisso: immettere una stringa di prefisso da aggiungere all'inizio dei nomi o dei percorsi dei file.
- Se i file da caricare sono in formato CSV, fornire le seguenti informazioni in Delimitatore:
- Delimitatore colonna: selezionare il tipo di delimitatore per le colonne. L'impostazione predefinita è virgola. Se si sceglie Personalizzato, immettere il delimitatore nel campo Delimitatore di colonna personalizzato.
- Delimitatore di riga: (facoltativo) selezionare questa casella di controllo Delimitatore di riga, quindi immettere un delimitatore di riga nel campo Delimitatore di riga personalizzato. Se non si immette un valore, il delimitatore viene rilevato dal file CSV.
- Carattere di escape: (facoltativo) selezionare questa casella di controllo, quindi selezionare un carattere di escape. Se si sceglie Personalizzato, immettere il carattere nel campo Carattere di escape personalizzato. Se non si immette un valore, non verrà visualizzato alcun carattere di escape per il testo.
- In File selezionati trascinare o selezionare i file che si desidera caricare nel bucket. Nota
Tutti i file devono avere la codifica UTF-8 e avere le stesse intestazioni di colonna e gli stessi indici. In caso contrario, il set di dati passa allo stato Richiede attenzione. Per l'elenco dei formati di file consentiti, vedere Formati di file supportati. - Selezionare un file per visualizzare un'anteprima del relativo contenuto. Nota
Vengono visualizzate solo le prime cinque colonne e righe dei file CSV. - (Per i file CSV). Per la colonna che si desidera etichettare, selezionarne il nome. Se la colonna non ha un nome, viene visualizzato il numero di indice.
- In Aggiungi etichette immettere le etichette da utilizzare per annotare il data set. Dopo aver immesso ogni etichetta, premere Invio.
- Fare clic su Successivo e andare al passo 8.
- Nella posizione dello storage degli oggetti, specificare la destinazione dello storage degli oggetti (bucket) in cui caricare i file locali:
-
Per caricare i file già esistenti in un bucket di storage degli oggetti, fare clic su Seleziona da storage degli oggetti e attenersi alla procedura riportata di seguito.
- Nella posizione dello storage degli oggetti specificare la destinazione dello storage degli oggetti (bucket) per popolare i file da utilizzare per il data set.
- URL storage degli oggetti: campo di sola lettura già popolato.
- Compartimento: selezionare il compartimento contenente il bucket.
- Spazio di nomi: popolato automaticamente in base al compartimento selezionato.
- Bucket: selezionare un bucket dalla lista. Se l'elenco è lungo, è possibile scegliere di visualizzare tutti i bucket. Se si fa clic su di esso, viene visualizzato un pannello in cui sono elencati tutti i bucket disponibili. Se è necessario creare un bucket, fare clic sul collegamento nel suggerimento accanto all'etichetta Bucket, che consente di accedere alla pagina della lista Bucket nel servizio di storage degli oggetti. Vedere Creazione di un gruppo.
- (Facoltativo) Prefisso: immettere una stringa di prefisso da aggiungere all'inizio dei nomi o dei percorsi dei file.
- (Facoltativo) Se i file sono in formato CSV, fornire le seguenti informazioni in Delimitatore:
- Selezionare Delimitatore colonna: selezionare il tipo di delimitatore per le colonne. L'impostazione predefinita è virgola. Se si sceglie Personalizzato, immetterlo nel delimitatore di colonna personalizzato.
- Delimitatore di riga: (facoltativo) selezionare questa casella di controllo e immettere un delimitatore di riga nel campo Delimitatore di riga personalizzato. Se non si immette un valore, il delimitatore viene rilevato dal file CSV.
- Carattere di escape: (facoltativo) selezionare questa casella di controllo, quindi selezionare un carattere di escape. Se si sceglie Personalizzato, immettere il carattere nel campo Carattere di escape personalizzato. Se non si immette un valore, non verrà visualizzato alcun carattere di escape per il testo.
- In File selezionati selezionare un file per visualizzare un'anteprima del relativo contenuto.Nota
Per i file CSV vengono visualizzate solo le prime cinque colonne e righe. - (Solo per file CSV) Selezionare il nome della colonna da etichettare per la colonna. Se la colonna non ha un nome, viene visualizzato il numero di indice.Nota
Tutti i file devono avere la codifica UTF-8 e avere le stesse intestazioni di colonna e gli stessi indici. In caso contrario, il set di dati passa allo stato Richiede attenzione. Per l'elenco dei formati di file consentiti, vedere Formati di file supportati. - In Aggiungi etichette immettere le etichette da utilizzare per annotare il data set. Dopo aver immesso ogni etichetta, premere Invio.
- Fare clic su Successivo.
- Nella posizione dello storage degli oggetti specificare la destinazione dello storage degli oggetti (bucket) per popolare i file da utilizzare per il data set.
- Nella pagina Rivedi, verificare le informazioni inserite. Se è necessario modificare i dettagli del data set, fare clic su Modifica. Se è necessario tornare indietro e modificare qualsiasi valore, fare clic su Modifica.
-
Per creare il data set ora, fare clic su Crea.
I record vengono generati quando viene creato il set di dati. Lo stato del set di dati diventa Aggiornamento durante la generazione dei record. Solo dopo aver creato i record, i file utilizzati vengono visualizzati nella pagina dei dettagli del data set.
-
Per creare il data set in un secondo momento utilizzando Resource Manager e Terraform, fare clic su Salva come stack per salvare la definizione della risorsa come configurazione Terraform.
Per informazioni sul salvataggio degli stack dalle definizioni delle risorse, vedere Creazione di uno stack da una pagina di creazione delle risorse.
Utilizzare il comando create del set di dati e i parametri richiesti per creare un set di dati: Per un elenco completo dei flag e delle opzioni variabili per i comandi CLI, consultare il manuale CLI Command Reference.oci data-labeling-service dataset create [OPTIONS]
Eseguire l'operazione CreateDataset per creare un set di dati.