Creare il data set
I modelli personalizzati Vision sono destinati agli utenti senza un background di data science. La creazione di un data set e l'istruzione di Vision per addestrare un modello basato sul data set consentono di disporre di un modello personalizzato pronto per lo scenario.
L'etichettatura dei dati è il processo di identificazione delle proprietà dei record, ad esempio documenti, testo e immagini, e di annotazione con etichette per identificare tali proprietà. La didascalia di un'immagine e l'identificazione di un oggetto in un'immagine sono entrambi esempi di un'etichetta dati. Puoi utilizzare Oracle Cloud Infrastructure Data Labeling per eseguire l'etichettatura dei dati. Per ulteriori informazioni, vedere la Guida al servizio di etichettatura dei dati. Ecco una descrizione dei passi da intraprendere:
- Raccogliere un numero sufficiente di immagini che corrispondono alla distribuzione dell'applicazione prevista.
Quando si sceglie il numero di immagini necessarie per il data set, utilizzare il maggior numero possibile di immagini nel data set di addestramento. Per ogni etichetta da rilevare, fornire almeno 10 immagini per l'etichetta. Si consiglia di fornire almeno 50 immagini per etichetta. Maggiore è il numero di immagini fornite, maggiore sarà la robustezza e la precisione del rilevamento. La robustezza è la capacità di generalizzare a nuove condizioni come l'angolo di visione o lo sfondo.
- Raccogli alcune varietà di altre immagini per catturare diversi angoli di acquisizione della fotocamera, condizioni di illuminazione, sfondi e altri.
Raccogliere un data set rappresentativo del problema e dello spazio su cui si intende applicare il modello addestrato. Mentre i dati provenienti da altri domini potrebbero funzionare, un set di dati generato dagli stessi dispositivi, ambienti e condizioni d'uso previsti supera qualsiasi altro.
Fornire prospettive sufficienti per le immagini, poiché il modello utilizza non solo le annotazioni per apprendere cosa è corretto, ma anche lo sfondo per apprendere cosa è sbagliato. Ad esempio, fornire viste da diversi lati dell'oggetto rilevato, con condizioni di illuminazione diverse, da diversi dispositivi di acquisizione delle immagini e così via. - Etichetta tutte le istanze degli oggetti che si verificano nel data set di origine.Mantenere le etichette coerenti. Se si etichettano molte mele insieme come una mela, farlo in modo coerente in ogni immagine. Non avere spazio tra gli oggetti e la casella di delimitazione. Le caselle di delimitazione devono corrispondere strettamente agli oggetti etichettati.Importante
Verificare che ciascuna di queste annotazioni sia importante per le prestazioni del modello.