Usando a Transcrição Ativa

Crie e gerencie jobs de transcrição ao vivo no serviço Speech.

O recurso de transcrição ao vivo fornece transcrição em tempo real, o que permite enviar fluxos de áudio e receber resultados de texto em tempo real. A transcrição em tempo real é necessária para muitos casos de uso em setores como assistência médica, call centers e mídia. Por exemplo, médicos e enfermeiros usam ditado médico, o que requer recursos em tempo real e aumenta a eficiência do trabalho. Com o lançamento da transcrição ao vivo, você pode obter uma transcrição precisa em seu aplicativo em menos de alguns segundos. Você pode usar a janela de texto incorporada para experimentar a transcrição ao vivo ou consultar o documento da API para obter informações sobre como integrar-se programaticamente ao serviço de transcrição em tempo real do OCI.

Criando uma Sessão de Transcrição ao Vivo

Crie e envie uma sessão de transcrição ao vivo do Speech para transcrever um fluxo de áudio ao vivo para texto.

Abra o menu de navegação e clique em Analytics & AI. Em Serviços de IA, clique em Fala.
No menu de navegação esquerdo, clique em Live transcribe.
Em Escopo da Lista, selecione o compartimento no qual você deseja trabalhar.
(Opcional) Na seção Configurar transcrição, Para personalizar a transcrição, selecione valores para uma ou mais das seguintes opções:
- Escolher tipo de modelo: Selecione o modelo de fala a ser usado para transcrição.
- Escolher domínio: Selecione o domínio do modelo de fala a ser usado.
- Escolher idioma: Selecione o idioma para transcrever.
- Punção: Configure a pontuação nas transcrições geradas. Há três opções disponíveis: Nenhum sem pontuação (o valor padrão), Automático para inserir pontuação automaticamente e Falado para inserir pontuação quando elas são faladas verbalmente.
- (Somente para o modelo Oracle) Limite de silêncio parcial: informe por quanto tempo, em milissegundos, o serviço aguarda mais fala, depois de parar de detectar atividade de fala, antes de encerrar o reconhecimento de fala.
- (Somente para o modelo Oracle) Limite de silêncio final: Informe quantos milissegundos de silêncio após uma palavra ser falada que o serviço aguarda para encerrar a sessão.
- (Somente para o modelo Oracle) Estabilidade parcial dos resultados: Selecione o nível de confiança necessário para os tokens mais recentes antes de os retornar como parte de um novo resultado parcialmente.
- (Somente para o modelo Oracle)Ativar personalizações: marque esta caixa de seleção para personalizar a sessão.
  - Selecione a personalização a ser usada. Altere os compartimentos, se necessário.
  - Clique em Substituir entidades. Somente personalizações contendo várias listas de entidades podem ser substituídas
Para iniciar uma sessão, clique em Iniciar sessão e comece a falar.
Para interromper uma sessão, pare de falar e clique em Interromper sessão.
(Opcional) Para exibir o arquivo JSON, clique em Exibir JSON.
(Opcional) Para redefinir a sessão, clique em Reset.

Documentação do Oracle Cloud Infrastructure

Usando a Transcrição Ativa

Criando uma Sessão de Transcrição ao Vivo