Usando a Transcrição Ativa

Crie e gerencie jobs de transcrição ao vivo no serviço Speech.

O recurso de transcrição ao vivo fornece transcrição em tempo real, o que permite enviar fluxos de áudio e receber resultados de texto em tempo real. A transcrição em tempo real é necessária para muitos casos de uso em setores como assistência médica, call centers e mídia. Por exemplo, médicos e enfermeiros usam ditado médico, o que requer recursos em tempo real e aumenta a eficiência do trabalho. Com o lançamento da transcrição ao vivo, você pode obter uma transcrição precisa em seu aplicativo em menos de alguns segundos. Você pode usar a janela de texto incorporada para experimentar a transcrição ao vivo ou consultar o documento da API para obter informações sobre como integrar-se programaticamente ao serviço de transcrição em tempo real do OCI.

Criando um Job de Transcrição Ativa

Crie e envie um trabalho de transcrição ao vivo do Speech para transcrever uma transmissão de áudio ao vivo para texto.

  1. Abra o menu de navegação e clique em Analytics & AI. Em Serviços de IA, clique em Fala.
  2. No menu de navegação esquerdo, clique em Live transcribe.
  3. Em Escopo da Lista, selecione o compartimento no qual você deseja trabalhar.
  4. (Opcional) Na seção Configurar transcrição, Para personalizar a transcrição, selecione valores para uma ou mais das seguintes opções:
    • Escolher domínio: Selecione o domínio do modelo de fala a ser usado.
    • Escolher idioma: Selecione o idioma para transcrever.
    • Punção: Configure a pontuação nas transcrições geradas. Há três opções disponíveis: Nenhum sem pontuação (o valor padrão), Automático para inserir pontuação automaticamente e Falado para inserir pontuação quando elas são faladas verbalmente.
    • Limite de silêncio parcial: informe por quanto tempo, em milissegundos, o serviço aguarda por fala adicional, depois de parar de detectar a atividade de fala, antes de encerrar o reconhecimento de fala.
    • Limite de silêncio final: Informe quantos milissegundos de silêncio depois que uma palavra for falada o serviço aguarda para encerrar a sessão.
    • Estabilidade parcial do resultado: Selecione o nível de confiança exigido para os tokens mais recentes antes de retorná-los como parte de um novo resultado parcial.
    • Ativar personalizações: Marque esta caixa de seleção para personalizar a sessão.
      • Selecione a personalização a ser usada. Altere os compartimentos, se necessário.
      • Clique em Substituir entidades. Somente personalizações contendo diversas listas de entidade podem ser substituídas
  5. Para iniciar uma sessão, clique em Iniciar sessão e comece a falar.
  6. Para interromper uma sessão, pare de falar e clique em Interromper sessão.
  7. (Opcional) Para exibir o arquivo JSON, clique em Exibir JSON.
  8. (Opcional) Para redefinir a sessão, clique em Reset.