Analisi di un video memorizzato mediante un modello personalizzato

Identifica funzioni e oggetti basati su scene e rileva facce e cornici di etichette in un video chiamando un modello personalizzato di analisi video.

Le dimensioni e la durata massime di ciascun video vengono visualizzate nella sezione Limiti.

Per ulteriori informazioni sull'analisi video, vedere la sezione su Analisi video memorizzata.

Per utilizzare un modello personalizzato in Vision, attenersi alla procedura riportata di seguito.Sono disponibili le metriche per analizzare le prestazioni del modello personalizzato.

Creare il data set

I modelli personalizzati Vision sono destinati agli utenti senza un background di data science. La creazione di un data set e l'istruzione di Vision per addestrare un modello basato sul data set consentono di disporre di un modello personalizzato pronto per lo scenario.

La chiave per creare un modello personalizzato utile è prepararlo e addestrarlo con un buon set di dati. Vision supporta il seguente formato di set di dati:Raccogliere un data set rappresentativo del problema e dello spazio su cui si intende applicare il modello addestrato. Mentre i dati provenienti da altri domini potrebbero funzionare, un set di dati generato dagli stessi dispositivi, ambienti e condizioni d'uso previsti supera qualsiasi altro.

L'etichettatura dei dati è il processo di identificazione delle proprietà dei record, ad esempio documenti, testo e immagini, e di annotazione con etichette per identificare tali proprietà. La didascalia di un'immagine e l'identificazione di un oggetto in un'immagine sono entrambi esempi di un'etichetta dati. Puoi utilizzare Oracle Cloud Infrastructure Data Labeling per eseguire l'etichettatura dei dati. Per ulteriori informazioni, vedere la Guida al servizio di etichettatura dei dati. Ecco una descrizione dei passi da intraprendere:

  1. Raccogliere un numero sufficiente di immagini che corrispondono alla distribuzione dell'applicazione prevista.

    Quando si sceglie il numero di immagini necessarie per il data set, utilizzare il maggior numero possibile di immagini nel data set di addestramento. Per ogni etichetta da rilevare, fornire almeno 10 immagini per l'etichetta. Si consiglia di fornire almeno 50 immagini per etichetta. Maggiore è il numero di immagini fornite, maggiore sarà la robustezza e la precisione del rilevamento. La robustezza è la capacità di generalizzare a nuove condizioni come l'angolo di visione o lo sfondo.

  2. Raccogli alcune varietà di altre immagini per catturare diversi angoli di acquisizione della fotocamera, condizioni di illuminazione, sfondi e altri.

    Raccogliere un data set rappresentativo del problema e dello spazio su cui si intende applicare il modello addestrato. Mentre i dati provenienti da altri domini potrebbero funzionare, un set di dati generato dagli stessi dispositivi, ambienti e condizioni d'uso previsti supera qualsiasi altro.

    Fornire prospettive sufficienti per le immagini, poiché il modello utilizza non solo le annotazioni per apprendere cosa è corretto, ma anche lo sfondo per apprendere cosa è sbagliato. Ad esempio, fornire viste da diversi lati dell'oggetto rilevato, con condizioni di illuminazione diverse, da diversi dispositivi di acquisizione delle immagini e così via.
  3. Etichetta tutte le istanze degli oggetti che si verificano nel data set di origine.
    Mantenere le etichette coerenti. Se si etichettano molte mele insieme come una mela, farlo in modo coerente in ogni immagine. Non avere spazio tra gli oggetti e la casella di delimitazione. Le caselle di delimitazione devono corrispondere strettamente agli oggetti etichettati.
    Importante

    Verificare che ciascuna di queste annotazioni sia importante per le prestazioni del modello.

Creazione di un modello personalizzato

Crea modelli personalizzati in Vision per estrarre insight dalle immagini senza dover ricorrere ai data scientist.

Prima di creare un modello personalizzato, è necessario effettuare le operazioni riportate di seguito.
  • Account tenancy a pagamento in Oracle Cloud Infrastructure.
  • Familiarità con Oracle Cloud Infrastructure Object Storage.
  • Criteri corretti.
  • Utilizzare la console per apprendere come creare un progetto Vision e come addestrare un modello di classificazione delle immagini e di rilevamento degli oggetti.

    1. Creare un progetto.
      1. Nella home page di Vision, in Modelli personalizzati, selezionare Progetti.
      2. Selezionare Crea progetto
      3. Selezionare il compartimento per il progetto.
      4. Immettere un nome e una descrizione per il progetto. Evitare di inserire informazioni riservate.
      5. Selezionare Crea progetto.
    2. Nell'elenco dei progetti, selezionare il nome del progetto creato.
    3. Nella pagina dei dettagli del progetto selezionare Crea modello.
    4. Selezionare il tipo di modello da addestrare: Classificazione immagine o Rilevamento oggetti.
    5. Selezionare i dati di esempio.
      • Se non si dispone di immagini annotate, selezionare Crea un nuovo set di dati.

        In OCI Data Labeling puoi creare un data set e aggiungere etichette o disegnare riquadri sul contenuto dell'immagine. Per ulteriori informazioni, vedere Creazione di un data set e la sezione sull'etichettatura delle immagini nella documentazione relativa all'etichettatura dei dati.

      • Se si dispone di un data set annotato esistente, selezionare Scegli data set esistente, quindi selezionare l'origine dati:
        • Se il data set è stato annotato in Etichettatura dati, selezionare Servizio di etichettatura dati, quindi selezionare il data set.
        • Se le immagini sono state annotate utilizzando uno strumento di terze parti, fare clic su Storage degli oggetti, quindi selezionare il bucket che contiene le immagini.
    6. Selezionare Successivo.
    7. Immettere un nome visualizzato per il modello personalizzato.
    8. (Facoltativo) Dare al modello una descrizione che consenta di individuarlo.
    9. Selezionare la durata della formazione.
      • Formazione consigliata Vision seleziona automaticamente la durata dell'addestramento per creare il modello migliore. L'allenamento può richiedere fino a 24 ore.
      • Formazione rapida Questa opzione produce un modello non completamente ottimizzato, ma disponibile in circa un'ora.
      • Personalizzato Questa opzione consente di impostare la durata massima dell'addestramento (in ore).
    10. Selezionare Successivo.
    11. Esaminare le informazioni fornite nei passi precedenti. Per apportare modifiche, selezionare Precedente.
    12. Quando si desidera avviare l'addestramento del modello personalizzato, selezionare Crea e addestra.
  • Per creare un progetto, usare il comando create e i parametri richiesti:

    oci ai-vision project create [OPTIONS]

    Per creare un modello, usare il comando create e i parametri richiesti:

    oci ai-vision model create [OPTIONS]
    Per un elenco completo dei flag e delle opzioni variabili per i comandi CLI, consultare il manuale CLI Command Reference.
  • Eseguire innanzitutto l'operazione CreateProject per creare un progetto.

    Eseguire quindi l'operazione CreateModel per creare un modello.

Addestrare il modello personalizzato

Dopo aver creato il data set, è possibile addestrare il modello personalizzato.

Addestrare il modello utilizzando una delle modalità di addestramento del modello personalizzato di Vision. Le modalità di formazione sono:
  • Formazione consigliata: Vision seleziona automaticamente la durata dell'addestramento per creare il modello migliore. L'allenamento può richiedere fino a 24 ore.
  • Formazione rapida: questa opzione produce un modello non completamente ottimizzato ma disponibile in circa un'ora.
  • Durata personalizzata: questa opzione consente di impostare la durata massima dell'allenamento.

La migliore durata dell'allenamento dipende dalla complessità del problema di rilevamento, dal numero tipico di oggetti in un'immagine, dalla risoluzione e da altri fattori. Considera queste esigenze e dedica più tempo all'aumento della complessità della formazione. Il tempo minimo di allenamento consigliato è di 30 minuti. Un tempo di allenamento più lungo offre maggiore precisione, ma rendimenti decrescenti con precisione nel tempo. Utilizzare la modalità di addestramento rapido per avere un'idea del minor tempo necessario per ottenere un modello che fornisca prestazioni ragionevoli. Utilizzare la modalità consigliata per ottenere un modello ottimizzato di base. Se vuoi un risultato migliore, aumenta il tempo di allenamento.

Chiama il modello personalizzato

I modelli personalizzati possono essere chiamati allo stesso modo del modello pre-addestrato.

È possibile chiamare il modello personalizzato per analizzare le immagini come singola richiesta o come richiesta batch. È necessario aver prima eseguito questi passi:
    1. Aprire il menu di navigazione e fare clic su Analytics e AI. In Servizi AI, fare clic su Visione.
    2. Nella pagina Vision fare clic su Analisi video.
    3. Selezionare il compartimento in cui si desidera memorizzare i risultati.
    4. Selezionare la posizione del video:
      • Demo
      • File locale
      • Storage degli oggetti
        1. (Facoltativo) Se è stata selezionata l'opzione Demo, fare clic su Analizza video demo per avviare l'analisi.
        2. (Facoltativo) Se è stata selezionata l'opzione File locale:
          1. Selezionare un bucket dalla lista. Se il bucket si trova in un compartimento diverso, fare clic su Modifica compartimento.
          2. (Facoltativo) Immettere un prefisso nel campo di testo Aggiungi prefisso.
          3. Trascinare il file video nell'area Seleziona file oppure fare clic su selezionarne uno... e passare all'immagine.
          4. Fare clic su Carica e analizza. Viene visualizzata la finestra di dialogo URL preautenticato per il video.
          5. (Facoltativo) Copiare l'URL.
          6. Fare clic su Chiudi.
        3. Se è stata selezionata l'opzione Storage degli oggetti, immettere l'URL del video e fare clic su Analizza.

      Viene richiamata l'API analyzeVideo e il modello analizza immediatamente il video. Viene visualizzato lo stato del job.

      L'area Risultati dispone di schede per ogni rilevamento delle etichette, rilevamento degli oggetti, rilevamento del testo e rilevamento del volto con punteggi di attendibilità e JSON di richiesta e risposta.

    5. (Facoltativo) Per arrestare il job in esecuzione, fare clic su Annulla.
    6. (Facoltativo) Per modificare la posizione di output, fare clic su Modifica posizione di output.
    7. (Facoltativo) Per selezionare gli elementi analizzati, fare clic su Funzionalità di analisi video e selezionare l'opzione appropriata tra le opzioni riportate di seguito.
      • Rilevamento etichette
      • Rilevamento oggetti
      • Rilevamento del testo
      • Rilevamento facciale
    8. (Facoltativo) Per generare il codice per l'inferenza video, fare clic su Codice per l'inferenza video.
    9. (Facoltativo) Per analizzare di nuovo i video, fare clic su Tracker job video e selezionare Video caricati di recente dal menu.
      1. Fare clic sul video che si desidera analizzare.
      2. Fare clic su Analizza.
    10. Per visualizzare lo stato di un job di analisi video, fare clic su Tracker job video e selezionare Ottieni stato job dal menu.
      1. Immettere l'OCID del job.
      2. Fare clic su Recupera stato job.
      3. (Facoltativo) Per arrestare il job in esecuzione, fare clic su Annulla.
      4. (Facoltativo) Per ottenere lo stato di un altro job, fare clic su Ottieni un altro stato di job video.
      5. (Facoltativo) Per ottenere la risposta JSON, fare clic su Recupera dati risposta.
      6. (Facoltativo) Per rimuovere lo stato di un job, fare clic su Rimuovi.
  • Utilizzare il comando analyze-video e i parametri necessari per classificare l'immagine.

    oci ai-vision analyze-video [OPTIONS]
    Per un elenco completo dei flag e delle opzioni variabili per i comandi CLI, consultare il manuale CLI Command Reference.
  • Eseguire l'operazione AnalyzeVideo per analizzare un'immagine.

Parametri modello personalizzato

Per i modelli personalizzati in Vision vengono fornite le metriche riportate di seguito.

Punteggio mAP@0.5
Il punteggio medio di precisione media (mAP) con una soglia di 0,5 viene fornito solo per i modelli di rilevamento oggetti personalizzati. Viene calcolato prendendo la precisione media su tutte le classi. Si va da 0,0 a 1,0 dove 1,0 è il miglior risultato.
Precision
La frazione di istanze rilevanti tra le istanze recuperate.
Richiamo
La frazione di istanze rilevanti recuperate.
Valore soglia
Soglia decisionale per effettuare una previsione di classe per le metriche.
Immagini totali
Numero totale di immagini utilizzate per la formazione e i test.
Immagini di test
Numero di immagini del data set utilizzate per i test e non per l'addestramento.
Durata formazione
Periodo di tempo, espresso in ore, durante il quale il modello è stato addestrato.