Utilizzo di un modello pre-addestrato nella console

Vision fornisce modelli pre-addestrati per estrarre insight dalle immagini, senza bisogno di data scientist.

In questo tutorial imparerai a:

Informazioni preliminari

Prima di utilizzare Vision, l'amministratore della tenancy deve impostare i criteri appropriati.

Impostazione dei criteri

Attenersi alla procedura riportata di seguito per impostare i criteri necessari per utilizzare Vision.

  1. Nel menu di navigazione della console selezionare Identità e sicurezza.
  2. In Identità, selezionare Criteri.
  3. Selezionare Crea criterio.
    Viene visualizzata la finestra Crea criterio.
  4. Immettere un nome. È possibile utilizzare solo caratteri alfanumerici, trattini, punti e caratteri di sottolineatura. Gli spazi non sono consentiti. Ad esempio, immettere vision-access-policy.
  5. Immettere una descrizione per aiutare gli altri utenti a conoscere lo scopo di questo set di criteri. Ad esempio, immettere Policy to access Vision service..
  6. Selezionare il compartimento.
  7. In Costruzione guidata criteri selezionare Mostra editor manuale.
  8. Aggiungere la seguente istruzione:
    allow any-user to use ai-service-vision-family in tenancy
  9. (Facoltativo) Per limitare l'accesso solo al gruppo di utenti, aggiungere il criterio seguente:
    allow group <your-group-name> to use ai-service-vision-family in tenancy
  10. Selezionare Crea.

1. Comprendere i requisiti dei dati

Vision lavora con molti formati di dati immagine per rilevare oggetti, assegnare etichette alle immagini, estrarre testo e altro ancora. Accetta i dati tramite lo storage degli oggetti. Se Vision viene eseguito nella console, è anche possibile fornire immagini memorizzate localmente.

Vision offre API sincrone e asincrone per l'analisi delle immagini. I requisiti in materia di dati per ciascuno di essi sono illustrati nella tabella seguente:
Requisiti dati API
API descrizione; Formato di input supportato
API sincrona
  • analyzeImage
  • analyzeDocument
Analizza singole immagini.
  • JPG, PNG. PDF e TIFF sono supportati anche con analyzeDocument
  • Fino a 5 MB
  • Input immagine singola
API asincrona Analizza diverse immagini o PDF a più pagine.
  • JPG, PNG. PDF e TIFF sono supportati anche con analyzeDocument
  • Supporta PDF multi-pagina
  • Ingresso fino a 2.000 immagini

2. Carica dati in storage degli oggetti

In questo passo, carichi nello storage degli oggetti le immagini e i documenti che desideri analizzare.

Completare 1. Comprendere i requisiti di dati prima di provare questa sezione.

Creare un bucket di storage degli oggetti

Se hai già un bucket nello storage degli oggetti che puoi utilizzare, vai direttamente alla sezione successiva sul caricamento dei file immagine.

  1. Dal menu di navigazione della console, selezionare Memorizzazione.
  2. In Storage degli oggetti selezionare Bucket.
  3. Nella pagina Bucket, in Ambito elenco, selezionare il compartimento.
  4. Selezionare Crea bucket. Viene visualizzato il riquadro Crea bucket.
  5. Immettere un valore in Nome gruppo. Non inserire informazioni riservate.
  6. In Livello di storage predefinito, selezionare Standard. Lasciare tutti gli altri campi ai valori predefiniti.
  7. Selezionare Crea.

Carica file immagine nel bucket di storage degli oggetti

  1. Nella pagina Bucket selezionare il nome del bucket in cui verranno caricate le immagini. Viene visualizzata la pagina dei dettagli del bucket.
  2. In Risorse, selezionare Oggetti per visualizzare la lista degli oggetti nel bucket.
  3. Selezionare Carica. Viene visualizzato il pannello Carica oggetti.
  4. Trascinare i file che si desidera caricare nel pannello o selezionare Seleziona file per selezionarli dai file locali.

3. AI documento

I passi per utilizzare le funzioni AI documento in Vision.

Completare 2. Caricare i dati nello storage degli oggetti prima di provare questa sezione.

Apri Vision Console

  1. Dal menu di navigazione della console, selezionare Analytics & AI.
  2. In Servizi AI, fare clic su Visione. Viene visualizzata la home page di Vision.

Usa AI documento

  1. In Visione, selezionare Documento AI. Viene visualizzata la pagina AI del documento.
  2. In Origine immagine selezionare Storage degli oggetti.
  3. Selezionare un documento caricato in 2. Caricare i dati nello storage degli oggetti. Viene richiamata l'interfaccia API analyzeDocument.
Queste funzioni vengono richiamate e i relativi risultati visualizzati nella console:
Risultati AI documento
Funzione descrizione; risultati
OCR (riconoscimento ottico caratteri) Trova e digitalizza le informazioni di testo dalle immagini. Il testo identificato nel documento viene visualizzato in Testo RAW nel riquadro Risultati.
Classificazione immagine documento Classifica i documenti in diversi tipi in base all'aspetto visivo, alle funzioni di alto livello e alle parole chiave estratte. La classificazione in un tipo di documento insieme a un punteggio di attendibilità viene visualizzata nel riquadro Risultati.
Classificazione linguistica Classifica la lingua del documento in base alle funzioni visive. La classificazione in un linguaggio del documento insieme a un punteggio di attendibilità viene visualizzata nel riquadro Risultati.
Estrazione tabelle Estrae il contenuto in formato tabulare, mantenendo le relazioni di riga e colonna delle celle. Nel riquadro Risultati, fare clic sulla scheda Tabella per visualizzare l'output.
Output PDF ricercabile Incorpora un layer trasparente sopra l'immagine del documento in formato PDF per renderla ricercabile in base alle parole chiave.

Nota: questa funzionalità è disponibile solo quando viene fornito un documento PDF.

Fare clic su PDF ricercabile. Un file PDF OCR viene scaricato sul computer.

4. Analisi dell'immagine

I passi per utilizzare le funzioni Analisi immagine in Vision.

Completare 2. Caricare i dati nello storage degli oggetti prima di provare questa sezione.

Apri Vision Console

  1. Dal menu di navigazione della console, selezionare Analytics & AI.
  2. In Servizi AI, selezionare Visione. Viene visualizzata la home page Vision.

Usa classificazione immagini

  1. In Visione, selezionare Classificazione immagine. Viene visualizzata la pagina Classificazione immagine.
  2. Seleziona storage degli oggetti.
  3. Selezionare un'immagine caricata in 2. Caricare i dati nello storage degli oggetti. Viene richiamata l'interfaccia API analyzeIamge.

I risultati della categorizzazione degli oggetti nell'immagine vengono visualizzati nella sezione Risultati. Esistono etichette per classificare gli oggetti rilevati e un punteggio di affidabilità per ogni oggetto.

Usa rilevamento oggetti

  1. In Visione, selezionare Rilevamento oggetti. Viene visualizzata la pagina Rilevamento oggetti.
  2. Seleziona storage degli oggetti.
  3. Selezionare un'immagine caricata in 2. Caricare i dati nello storage degli oggetti. Viene richiamata l'interfaccia API analyzeIamge.

I risultati vengono visualizzati nella sezione Risultati. Nel riquadro Risultati vengono visualizzati gli oggetti rilevati, un punteggio di affidabilità per ciascun oggetto e una casella di delimitazione evidenziata intorno a ciascun oggetto. Se si fa clic su un'etichetta, viene visualizzata l'immagine in cui viene rilevato l'oggetto.

Pagina successiva

Ora sai come utilizzare Vision con modelli pre-addestrati, prova a usarlo con modelli personalizzati.