Criando um Job de Transação
Crie e envie um job para transcrever um ou mais arquivos de mídia para arquivos de texto no serviço Speech.
Antes de começar
- 
Armazene os arquivos de mídia que você deseja transcrever em um bucket do Object Storage. 
- 
Para comparar os modelos Whisper e Oracle ASR para criação de jobs de transcrição, consulte Comparando Whisper e Modelos Oracle ASR. 
- Para criar um job de transcrição, siga estas etapas: - Abra o menu de navegação e clique em Analytics & AI. Em AI Services, clique em Speech.
- No menu de navegação do lado esquerdo, clique em Jobs de transcrição
- Em Escopo da lista, selecione o compartimento no qual você deseja trabalhar.
- Clique em Criar job.
- 
Na página de informações básicas, digite um nome exclusivo (limite de 255 caracteres) para o projeto. O nome deve incluir um ou mais caracteres alfanuméricos, traços ou sublinhados em qualquer ordem. Se você não fornecer um nome, ele será gerado automaticamente para você.
Por exemplo: AiSpeechTranscriptionJob20220804134759
- (Opcional) Informe uma descrição (limite de 400 caracteres) para o job.
- Selecione o compartimento no qual criar o job, se for diferente daquele exibido.
- 
Em Entrada, selecione um bucket de entrada de dados que contenha o arquivo de mídia que você deseja transcrever.
Se o bucket que você deseja não estiver no compartimento selecionado, altere o compartimento. 
- Em Saída, selecione onde deseja armazenar os arquivos de saída, no bucket de entrada ou em outro bucket. Para usar outro bucket, selecione-o.
- (Opcional) Digite um prefixo de saída para separar e classificar os arquivos no bucket. 
Por exemplo, você pode digitar call_ctrpara arquivos de mídia do call center.Você também pode criar uma pasta de saída em seu bucket usando uma barra (/). Por exemplo, MyResults/armazena todos os arquivos transcritos em uma pastaMyResultsno bucket.
- 
Selecione o tipo de modelo do job que você está criando.
Observação
 Os tipos de modelo suportados são Oracle, Whisper Medium, Whisper Large V2 (sob solicitação de serviço) e Whisper Large V3 Turbo (novo). Consulte Comparando Modelos de Whisper e Oracle ASR para decidir o tipo de modelo a ser usado.
- 
Selecione o idioma do arquivo de mídia. 
Você pode procurar o idioma apropriado por idioma. O inglês (US English for ORACLE) é o padrão. Os modelos de sussurro suportam a identificação do idioma e podem ser usados selecionando automático como o código do idioma na lista suspensa. 
- (Opcional) Para incluir os formatos SRT e JSON na transcrição, selecione Obter formato de transcrição SRT.
- 
Se você não quiser que sua transcrição seja pontuada, desmarque Ativar pontuação. 
Observação
 A opção Ativar pontuação está selecionada para modelos do Sussurro e não pode ser limpa.
- (Opcional) Para identificar os alto-falantes no arquivo de entrada, selecione Ativar diarização.
Você pode permitir que o serviço Speech detecte automaticamente o número de alto-falantes exclusivos no arquivo de entrada ou pode inserir um número. O número mínimo de alto-falantes é 2 e o máximo é 16. Observação
 O uso de diarização aumenta a latência da tarefa de transcrição, razão pela qual essa opção é desativada por padrão. 
- 
Para adicionar filtros para alterar a forma como o arquivo de saída é gerado, clique em Adicionar filtro. 
- Selecione um tipo de filtro. Profanidade é o padrão.
- 
Selecione o modo de filtro:
Por exemplo, o filtro de palavrões oferece estes modos: - 
Máscara: Qualquer palavrão detectado é mascarado na transcrição com asteriscos, exceto pela primeira letra. 
- 
Remover: Qualquer palavrão detectado é substituído por um asterisco na transcrição. 
- 
Tag: O Profanity não é mascarado ou removido, mas está marcado como TYPE: "Profanity"na transcrição.
 
- 
 
- (Opcional) Para adicionar mais definições, clique em Adicionar definições adicionais e informe uma chave e seu valor.
Exemplo:- Chave: Este é o valor da chave, por exemplo, whisperPrompt.Você pode adicionar quantas chaves forem necessárias. Para excluir uma chave, selecione o X ao lado do campo Valor. Se o modelo Whisper for selecionado, esse campo poderá ser usado para passar um prompt para ajudar na transcrição. A única chave suportada é whisperPrompt. Se qualquer outra chave for transmitida, a solicitação falhará, pois é considerada uma entrada inválida. O comprimento máximo do prompt de valor é de 4000 caracteres, permite apenas caracteres alfanuméricos e pontuação (. , ! ? - : ; ' "), e é específico para Whisper. A validação é executada em segundo plano e o job falhará se o prompt for maior que esse limite. 
- Valor: Este é um valor de prompt e pode ter várias palavras. O campo é um exemplo para mostrar todo o texto inserido.
 Observação
 A adição de um prompt ao modelo de sussurro pode gerar resultados inesperados às vezes.
- Chave: Este é o valor da chave, por exemplo, whisperPrompt.
- (Opcional) Clique em Mostrar opções avançadas para designar tags ao job. As tags ajudam a localizar e rastrear recursos facilmente, selecionando um namespace de tag e informando a chave e o valor.
O serviço Tagging descreve as várias tags que você pode usar para organizar e localizar recursos, incluindo tags de rastreamento de custo. 
- Clique em Próximo para escolher os arquivos do job.
- 
Marque as caixas de seleção dos arquivos de mídia que você deseja transcrever ou marque todos eles marcando a caixa de seleção ao lado de Nome.
Observação
 - 
O tamanho máximo do arquivo é 2 GB. 
- 
A duração do arquivo é de no máximo 4 horas. 
 
- 
- 
Clique em Submeter para iniciar o job.
Um job pode ser executado em segundos ou horas, dependendo do tamanho e do número de arquivos selecionados. Durante a execução, o job está em um estado em andamento que muda para bem-sucedido ou com falha quando termina. Você pode selecionar um job para ir para sua página de detalhes. 
 
- Use o comando create e os parâmetros necessários para criar um trabalho de transcrição. - oci speech transcription-job create [OPTIONS]- Evite digitar informações confidenciais. - Para obter uma lista completa de flags e opções de variáveis para comandos da CLI, consulte a Referência de Comando da CLI. 
- Use as operações CreateTranscriptionJob e ChangeTranscriptionJobCompartment para criar um job.