Criando um Job de Transação

Crie e envie um job para transcrever um ou mais arquivos de mídia para arquivos de texto no serviço Speech.

Antes de começar

  • Armazene os arquivos de mídia que você deseja transcrever em um bucket do Object Storage.

  • Para comparar os modelos Whisper e Oracle ASR para criação de jobs de transcrição, consulte Comparando Whisper e Modelos Oracle ASR.

  • Para criar um job de transcrição, siga estas etapas:
    1. Abra o menu de navegação e clique em Analytics & AI. Em AI Services, clique em Speech.
    2. No menu de navegação do lado esquerdo, clique em Jobs de transcrição
    3. Em Escopo da lista, selecione o compartimento no qual você deseja trabalhar.
    4. Clique em Criar job.
    5. Na página de informações básicas, digite um nome exclusivo (limite de 255 caracteres) para o projeto. O nome deve incluir um ou mais caracteres alfanuméricos, traços ou sublinhados em qualquer ordem. Se você não fornecer um nome, ele será gerado automaticamente para você.

      Por exemplo:

      AiSpeechTranscriptionJob20220804134759

    6. (Opcional) Informe uma descrição (limite de 400 caracteres) para o job.
    7. Selecione o compartimento no qual criar o job, se for diferente daquele exibido.
    8. Em Entrada, selecione um bucket de entrada de dados que contenha o arquivo de mídia que você deseja transcrever.

      Se o bucket que você deseja não estiver no compartimento selecionado, altere o compartimento.

    9. Em Saída, selecione onde deseja armazenar os arquivos de saída, no bucket de entrada ou em outro bucket. Para usar outro bucket, selecione-o.
    10. (Opcional) Digite um prefixo de saída para separar e classificar os arquivos no bucket.

      Por exemplo, você pode digitar call_ctr para arquivos de mídia do call center.

      Você também pode criar uma pasta de saída em seu bucket usando uma barra (/). Por exemplo, MyResults/ armazena todos os arquivos transcritos em uma pasta MyResults no bucket.

    11. Selecione o tipo de modelo do job que você está criando.
      Observação

      Os tipos de modelo suportados são Oracle, Whisper Medium, Whisper Large V2 (sob solicitação de serviço) e Whisper Large V3 Turbo (novo). Consulte Comparando Modelos de Whisper e Oracle ASR para decidir o tipo de modelo a ser usado.
    12. Selecione o idioma do arquivo de mídia.

      Você pode procurar o idioma apropriado por idioma. O inglês (US English for ORACLE) é o padrão.

      Os modelos de sussurro suportam a identificação do idioma e podem ser usados selecionando automático como o código do idioma na lista suspensa.

    13. (Opcional) Para incluir os formatos SRT e JSON na transcrição, selecione Obter formato de transcrição SRT.
    14. Se você não quiser que sua transcrição seja pontuada, desmarque Ativar pontuação.
      Observação

      A opção Ativar pontuação está selecionada para modelos do Sussurro e não pode ser limpa.
    15. (Opcional) Para identificar os alto-falantes no arquivo de entrada, selecione Ativar diarização.

      Você pode permitir que o serviço Speech detecte automaticamente o número de alto-falantes exclusivos no arquivo de entrada ou pode inserir um número. O número mínimo de alto-falantes é 2 e o máximo é 16.

      Observação

      O uso de diarização aumenta a latência da tarefa de transcrição, razão pela qual essa opção é desativada por padrão.

    16. Para adicionar filtros para alterar a forma como o arquivo de saída é gerado, clique em Adicionar filtro.
      1. Selecione um tipo de filtro. Profanidade é o padrão.
      2. Selecione o modo de filtro:

        Por exemplo, o filtro de palavrões oferece estes modos:

        • Máscara: Qualquer palavrão detectado é mascarado na transcrição com asteriscos, exceto pela primeira letra.

        • Remover: Qualquer palavrão detectado é substituído por um asterisco na transcrição.

        • Tag: O Profanity não é mascarado ou removido, mas está marcado como TYPE: "Profanity" na transcrição.

    17. (Opcional) Para adicionar mais definições, clique em Adicionar definições adicionais e informe uma chave e seu valor.
      Exemplo:
      • Chave: Este é o valor da chave, por exemplo, whisperPrompt.

        Você pode adicionar quantas chaves forem necessárias. Para excluir uma chave, selecione o X ao lado do campo Valor.

        Se o modelo Whisper for selecionado, esse campo poderá ser usado para passar um prompt para ajudar na transcrição. A única chave suportada é whisperPrompt. Se qualquer outra chave for transmitida, a solicitação falhará, pois é considerada uma entrada inválida.

        O comprimento máximo do prompt de valor é de 4000 caracteres, permite apenas caracteres alfanuméricos e pontuação (. , ! ? - : ; ' "), e é específico para Whisper. A validação é executada em segundo plano e o job falhará se o prompt for maior que esse limite.

      • Valor: Este é um valor de prompt e pode ter várias palavras. O campo é um exemplo para mostrar todo o texto inserido.
      Observação

      A adição de um prompt ao modelo de sussurro pode gerar resultados inesperados às vezes.
    18. (Opcional) Clique em Mostrar opções avançadas para designar tags ao job. As tags ajudam a localizar e rastrear recursos facilmente, selecionando um namespace de tag e informando a chave e o valor.

      O serviço Tagging descreve as várias tags que você pode usar para organizar e localizar recursos, incluindo tags de rastreamento de custo.

    19. Clique em Próximo para escolher os arquivos do job.
    20. Marque as caixas de seleção dos arquivos de mídia que você deseja transcrever ou marque todos eles marcando a caixa de seleção ao lado de Nome.
      Observação

      • O tamanho máximo do arquivo é 2 GB.

      • A duração do arquivo é de no máximo 4 horas.

    21. Clique em Submeter para iniciar o job.

      Um job pode ser executado em segundos ou horas, dependendo do tamanho e do número de arquivos selecionados. Durante a execução, o job está em um estado em andamento que muda para bem-sucedido ou com falha quando termina. Você pode selecionar um job para ir para sua página de detalhes.

      • Cada cargo pode ter até 100 tarefas.

      • Os trabalhos são retidos por 90 dias.

  • Use o comando create e os parâmetros necessários para criar um trabalho de transcrição.

    oci speech transcription-job create [OPTIONS]

    Evite digitar informações confidenciais.

    Para obter uma lista completa de flags e opções de variáveis para comandos da CLI, consulte a Referência de Comando da CLI.

  • Use as operações CreateTranscriptionJob e ChangeTranscriptionJobCompartment para criar um job.