Uso della trascrizione in tempo reale

Creare e gestire job di trascrizione in tempo reale nel servizio Speech.

La funzione di trascrizione live fornisce trascrizione in tempo reale, che consente di inviare flussi audio e ricevere risultati di testo in tempo reale. La trascrizione in tempo reale è necessaria per molti casi d'uso in settori quali sanità, call center e media. Ad esempio, medici e infermieri utilizzano la dettatura medica, che richiede capacità in tempo reale e aumenta l'efficienza del lavoro. Con il rilascio della trascrizione live, puoi ottenere una trascrizione accurata nella tua applicazione in meno di pochi secondi. Puoi utilizzare la finestra di testo incorporata per provare a trascrivere in tempo reale o fare riferimento al documento API per informazioni su come integrare a livello di programmazione con il servizio di trascrizione in tempo reale OCI.

Creazione di una sessione di trascrizione attiva

Crea e invia una sessione di trascrizione live Speech per trascrivere un flusso audio live in testo.

  1. Aprire il menu di navigazione e fare clic su Analytics e AI. In Servizi AI fare clic su Discorso.
  2. Nel menu di navigazione a sinistra, fare clic su Trascrizione attiva.
  3. In Ambito elenco, selezionare il compartimento in cui si desidera lavorare.
  4. (Facoltativo) Nella sezione Configura trascrizione, per personalizzare la trascrizione, selezionare i valori per una o più delle seguenti opzioni:
    • Scegli tipo di modello: selezionare il modello vocale da utilizzare per la trascrizione.
    • Scegli dominio: selezionare il dominio del modello vocale da utilizzare.
    • Scegli lingua: selezionare la lingua in cui eseguire la trascrizione.
    • Punteggiatura: consente di configurare la punteggiatura nelle trascrizioni generate. Sono disponibili tre opzioni: Nessuno per l'assenza di punteggiatura (il valore predefinito), Automatico per l'inserimento automatico della punteggiatura e Parlato per l'inserimento della punteggiatura quando viene pronunciata verbalmente.
    • (Solo per il modello Oracle) Soglia di silenzio parziale: immettere per quanto tempo, in millisecondi, il servizio attende più interventi vocali, dopo che smette di rilevare l'attività vocale, prima di terminare il riconoscimento vocale.
    • (Solo per il modello Oracle) Soglia di silenzio finale: immettere quanti millisecondi di silenzio dopo la pronuncia di una parola che il servizio attende di terminare la sessione.
    • (Solo per il modello Oracle) Stabilità parziale dei risultati: selezionare la quantità di affidabilità richiesta per i token più recenti prima di restituirli come parte di un nuovo risultato parzialmente.
    • (Solo per il modello Oracle)Abilita personalizzazioni: selezionare questa casella di controllo per personalizzare la sessione.
      • Selezionare la personalizzazione da utilizzare. Modificare i compartimenti, se necessario.
      • Fare clic su Sostituisci entità. È possibile sostituire soltanto le personalizzazioni contenenti diverse liste di entità
  5. Per avviare una sessione, fare clic su Avvia sessione e iniziare a parlare.
  6. Per arrestare una sessione, smettere di parlare e fare clic su Arresta sessione.
  7. (Facoltativo) Per visualizzare il file JSON, fare clic su Visualizza JSON.
  8. (Facoltativo) Per ripristinare la sessione, fare clic su Reimposta.