Creazione di un job di trascrizione
Creare e sottomettere un job per trascrivere uno o più file multimediali in file di testo nel servizio di sintesi vocale.
Informazioni preliminari
-
Memorizza i file multimediali che desideri trascrivere in un bucket di storage degli oggetti.
-
Per confrontare i modelli Whisper e Oracle ASR per la creazione dei job di trascrizione, vedere Confronto tra modelli Whisper e Oracle ASR.
Per creare un job di trascrizione, effettuare le operazioni riportate di seguito. - Aprire il menu di navigazione e fare clic su Analytics e AI. In Servizi AI fare clic su Discorso.
- Nel menu di navigazione a sinistra fare clic su Job di trascrizione.
- In Ambito elenco, selezionare il compartimento in cui si desidera lavorare.
- Fare clic su Create job.
-
Nella pagina delle informazioni di base, immettere un nome univoco (limite 255 caratteri) per il progetto. Il nome deve includere uno o più caratteri alfanumerici, lineette o caratteri di sottolineatura in qualsiasi ordine. Se non si fornisce un nome, viene generato automaticamente un nome.
Ad esempio:
AiSpeechTranscriptionJob20220804134759
- (Facoltativo) Immettere una descrizione (limite di 400 caratteri) per il job.
- Selezionare il compartimento in cui creare il job, se diverso da quello visualizzato.
-
In Input selezionare un bucket di input dati contenente il file di supporto che si desidera trascrivere.
Se il bucket che si desidera non si trova nel compartimento selezionato, modificare il compartimento.
- In Output, selezionare la posizione in cui si desidera memorizzare i file di output, nel bucket di input o in un bucket diverso. Per utilizzare un bucket diverso, selezionarlo.
- (Facoltativo) Immettere un prefisso di output per separare e ordinare i file nel bucket.
Ad esempio, è possibile immettere
call_ctr
per i file multimediali del call center.È inoltre possibile creare una cartella di output nel bucket utilizzando una barra (/). Ad esempio,
MyResults/
memorizza tutti i file trascritti in una cartellaMyResults
nel bucket. -
Selezionare il tipo di modello del job che si sta creando.
Nota
I tipi di modello supportati sono Oracle, Whisper Medium, Whisper Large V2 (su richiesta di assistenza) e Whisper Large V3 Turbo (nuovo). Per decidere il tipo di modello da utilizzare, vedere Confronto tra modelli Whisper e Oracle ASR. -
Selezionare la lingua del file multimediale.
È possibile cercare la lingua appropriata per lingua. L'inglese (inglese USA per ORACLE) è l'impostazione predefinita.
I modelli Whisper supportano l'identificazione della lingua e possono essere utilizzati selezionando auto come codice della lingua nell'elenco a discesa.
- (Facoltativo) Per includere sia il formato SRT che il formato JSON nella trascrizione, selezionare Ottieni formato di trascrizione SRT.
-
Se non si desidera che la trascrizione sia punteggiata, deselezionare Abilita punteggiatura.
Nota
Abilita punteggiatura è selezionato per i modelli Whisper e non può essere cancellato. - (Facoltativo) Per identificare gli altoparlanti nel file di input, selezionare Abilita diarizzazione.
È possibile consentire al servizio di sintesi vocale di rilevare automaticamente il numero di altoparlanti univoci nel file di input oppure immettere un numero. Il numero minimo di altoparlanti è 2 e il massimo è 16.
Nota
L'utilizzo della diarizzazione aumenta la latenza del task di trascrizione, motivo per cui questa opzione è disabilitata per impostazione predefinita.
-
Per aggiungere filtri per modificare la modalità di generazione del file di output, fare clic su Aggiungi filtro.
- Selezionare un tipo di filtro. Il valore predefinito è Profanity.
-
Selezionare la modalità filtro:
Ad esempio, il filtro di volgarità offre le seguenti modalità:
-
Maschera: qualsiasi volgarità rilevata viene mascherata nella trascrizione con asterischi ad eccezione della prima lettera.
-
Rimuovi: qualsiasi profilo rilevato viene sostituito con un asterisco nella trascrizione.
-
Tag: la profanità non viene mascherata o rimossa, ma viene contrassegnata come
TYPE: "Profanity"
nella trascrizione.
-
- (Facoltativo) Per aggiungere altre impostazioni, fare clic su Aggiungi impostazioni aggiuntive, quindi immettere una chiave e il relativo valore.
Esempio:
- Chiave: questo è il valore della chiave, ad esempio whisperPrompt.
È possibile aggiungere tutte le chiavi necessarie. Per eliminare una chiave, selezionare la X accanto al campo Valore.
Se è selezionato il modello Whisper, questo campo può essere utilizzato per passare un prompt per facilitare la trascrizione. L'unica chiave supportata è whisperPrompt. Se vengono passate altre chiavi, la richiesta non riesce come viene considerata un input non valido.
La lunghezza massima del prompt dei valori è di 4000 caratteri, consente solo caratteri alfanumerici e punteggiatura (. , ! ? - : ; ' ") ed è specifica di Whisper. La convalida viene eseguita in background e il job non riesce se il prompt è più lungo di questo limite.
- Valore: si tratta di un valore di prompt che può contenere più parole. Il campo è un esempio per mostrare tutto il testo immesso.
Nota
L'aggiunta di un prompt al modello sussurro potrebbe produrre risultati imprevisti a volte. - Chiave: questo è il valore della chiave, ad esempio whisperPrompt.
- (Facoltativo) Fare clic su Mostra opzioni avanzate per assegnare tag al job. Le tag consentono di individuare e tenere traccia facilmente delle risorse selezionando uno spazio di nomi tag, quindi immettendo la chiave e il valore.
Nella sezione Applicazione di tag vengono descritte le varie tag che è possibile utilizzare per organizzare e trovare le risorse, tra cui le tag di tracciamento dei costi.
- Fare clic su Avanti per scegliere i file per il job.
-
Selezionare le caselle di controllo relative ai file multimediali che si desidera trascrivere oppure selezionarle tutte selezionando la casella di controllo accanto a Nome.
Nota
-
La dimensione massima del file è di 2 GB.
-
La durata del file è massima di 4 ore.
-
-
Fare clic su Sottometti per avviare il job.
Un job può essere eseguito in secondi o ore a seconda delle dimensioni e del numero di file selezionati. Durante l'esecuzione, lo stato del job è In corso e cambia in Operazione riuscita o Non riuscita al termine dell'esecuzione. È possibile selezionare un job per passare alla relativa pagina dei dettagli.
Utilizzare il comando create e i parametri richiesti per creare un job di trascrizione.
oci speech transcription-job create [OPTIONS]
Evitare di fornire informazioni riservate.
Per un elenco completo dei flag e delle opzioni di variabile per i comandi CLI, consultare CLI Command Reference.
Per creare un job, utilizzare le operazioni CreateTranscriptionJob e ChangeTranscriptionJobCompartment.