Criar Incorporações de Texto no Serviço Generative AI

Use os modelos do Cohere Embed na OCI Generative AI para converter texto para incorporações de vetores para uso em aplicativos para pesquisas semânticas, classificação ou clusterização de texto.

Os dados de entrada para incorporações de texto devem ter os seguintes requisitos:

  • Você pode adicionar frases, frases ou parágrafos para incorporações de uma frase por vez ou fazendo upload de um arquivo.
  • São permitidos somente arquivos com uma extensão .txt.
  • Se você usar um arquivo de entrada, cada sentença, frase ou parágrafo de entrada no arquivo deverá ser separado por um caractere de nova linha.
  • São permitidas no máximo 96 entradas para cada execução.
  • Na Console, cada entrada deve ter menos de 512 tokens para os modelos somente de texto.
  • Se uma entrada for muito longa, selecione se deseja cortar o início ou o final do texto para caber no limite do token definindo o parâmetro Truncar como Iniciar ou Final. Se uma entrada exceder o limite de token 512 e o parâmetro Truncate for definido como None, você receberá uma mensagem de erro.
  • Para os modelos de texto e imagem, você pode ter arquivos e entradas que somam até 128.000 tokens.
  • Para os modelos de incorporação de texto e imagem, como Cohere Embed English Image V3, você pode adicionar texto ou adicionar apenas uma imagem. Para a imagem, você pode usar a API. A entrada da imagem não está disponível na Console. Para API, insira uma imagem codificada em base64 em cada execução. Por exemplo, uma imagem de 512 x 512 é convertida em cerca de 1.610 tokens.
    1. Na barra de navegação da Console, selecione uma região com IA Generativa, por exemplo, Meio-Oeste dos EUA (Chicago). Consulte quais modelos são oferecidos na sua região.
    2. Abra o menu de navegação e selecione Análise e IA. Em Serviços de IA, selecione IA Generativa.
    3. Selecione um compartimento no qual você tenha permissão para trabalhar. Se você não acessar o playground, peça ao administrador para fornecer acesso aos recursos do serviço Generative AI e retorne às etapas a seguir.
    4. Selecione Playground.
    5. Selecione Incorporação.
    6. Selecione um modelo para criar incorporações de texto executando uma das seguintes ações:
      • Na lista Modelo, selecione um modelo.
      • Selecione Exibir detalhes do modelo e, em seguida, Escolher modelo.
    7. (Opcional) Para usar um exemplo da lista Exemplo, use as seguintes etapas:
      1. Selecione um exemplo na lista Exemplo.
      2. Selecione Executar para gerar incorporações para o exemplo.
      3. Revise uma versão bidimensional da saída na seção Projeção do vetor de saída.

        Para visualizar a saída com incorporações, os vetores de saída são projetados em duas dimensões e plotados como pontos. Os pontos próximos correspondem às frases que o modelo considera semelhantes.

      4. Selecione Limpar para remover todas as frases e iniciar a geração de incorporações para novas frases.
    8. (Opcional) Adicione uma imagem .png ou .jpg com um tamanho de 5 MB ou menos.
      Apenas uma imagem é permitida.
    9. Na área Entrada de frase, digite o texto de uma das seguintes maneiras:
      • Digite uma sentença na caixa 1. e, em seguida, selecione Adicionar sentença para adicionar mais frases.
      • Selecione Fazer upload de arquivo e selecione um arquivo com texto que você deseja adicionar.
      Observação

      Somente arquivos com uma extensão .txt são permitidos. Cada sentença, frase ou parágrafo de entrada deve ser separado por um caractere de nova linha. Um máximo de 96 entradas são permitidas para cada execução e cada entrada deve ter menos de 512 tokens. Você pode adicionar frases manualmente ou fazer upload de mais de um arquivo até atingir o número máximo de entradas.
    10. Para o parâmetro Truncar, selecione se deseja truncar os tokens inicial ou final quando os tokens excederem o número máximo de tokens permitidos (512).
      Dica

      Para entrada que excede 512 tokens, se você definir o parâmetro Truncar como Nenhum, receberá uma mensagem de erro. Antes da execução de um modelo incorporado, selecione Iniciar ou Final para os parâmetros Truncar.
    11. Selecione Executar.
    12. Revise uma versão bidimensional da saída na seção Projeção do vetor de saída.
      Para visualizar as saídas com incorporações, os vetores de saída são projetados em duas dimensões e plotados como pontos. Os pontos próximos correspondem às frases que o modelo considera semelhantes.
    13. Quando estiver satisfeito com o resultado, selecione Exportar incorporações para JSON para obter um arquivo JSON que contenha um vetor de 1024 dimensões para cada entrada.
    14. (Opcional) Selecione Exibir código, selecione uma linguagem de programação ou uma estrutura, Selecione Copiar código e cole o código em um arquivo. Verifique se o arquivo mantém o formato do código colado.
      Dica

      Se você estiver usando o código em um aplicativo:

    15. (Opcional) Selecione Limpar para remover todas as sentenças e iniciar a geração de incorporações para novas frases.
      Observação

      Quando você Seleciona Limpar, o parâmetro Truncar é redefinido para o valor padrão Nenhum.
  • Para criar incorporações para texto, use a operação embed-text-result.

    Digite o comando a seguir para obter uma lista de opções para criar incorporações de texto.

    oci generative-ai-inference embed-text-result embed-text -h

    Para obter uma lista completa de parâmetros e valores para os comandos da CLI do OCI Generative AI, consulte CLI de Inferência de IA Generativa e CLI de Gerenciamento de IA Generativa.

  • Execute a operação EmbedText para criar incorporações de texto.

    Para obter informações sobre como usar a API e assinar solicitações, consulte a documentação da API REST e Credenciais de Segurança. Para obter informações sobre SDKs, consulte SDKs e a CLI.