Cohere Embed Multilingual 3

O modelo cohere.embed-multilingual-v3.0 transforma cada frase, sentença ou parágrafo que você insere em uma matriz.

Você pode usar os modelos de incorporação para encontrar similaridade em frases semelhantes em contexto ou categoria. As incorporações são normalmente armazenadas em um banco de dados vetorial. As incorporações são usadas principalmente para pesquisas semânticas em que a função de pesquisa se concentra no significado do texto que está pesquisando, em vez de encontrar resultados com base em palavras-chave.

Disponível nestas regiões

  • Leste do Brasil (São Paulo)
  • Centro da Alemanha (Frankfurt)
  • Centro do Japão (Osaka)
  • Centro da Arábia Saudita (Riad) (somente cluster de IA dedicado)
  • Leste dos EAU (Dubai)
  • Sul do Reino Unido (Londres)
  • Centro-Oeste dos EUA (Chicago)

Principais Recursos

  • Funciona em inglês e multilíngue.
  • O modelo cria um vetor de 1.024 dimensões para cada incorporação.
  • No máximo 96 frases por execução.
  • Máximo de 512 tokens para cada entrada.
  • Melhor para casos de uso quando:

Cluster de IA Dedicado para o Modelo

Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.

Modelo Base Cluster de Ajuste Cluster de Hosts Informações da Página de Preços Aumento do Limite do Cluster de Solicitações
  • Nome do Modelo: Cohere Embed Multilingual 3
  • Nome do Modelo do OCI: cohere.embed-multilingual-v3.0
Não disponível para ajuste fino
  • Tamanho da Unidade: Embed Cohere
  • Unidades Obrigatórias: 1
  • Nome do produto da página de preços: Embed Cohere - Dedicated
  • Para Hospedagem, Multiplique o Preço Unitário: x1
  • Nome do Limite: dedicated-unit-embed-cohere-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1
Dica

  • Se você não tiver limites de cluster suficientes em sua tenancy para hospedar um modelo Incorporado em um cluster de IA dedicado, solicite o limite dedicated-unit-embed-cohere-count para aumentar em 1.

Datas de Liberação e Baixa

Modelo Data de Liberação Data de Aposentadoria Sob Demanda Data de Baixa do Modo Dedicado
cohere.embed-multilingual-v3.0 2,024-2-7 2,026-1-22 cohere.embed-v4.0
Importante

Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.

Incorporando Parâmetro de Modelo

Ao usar os modelos de incorporação, você pode obter uma saída diferente alterando o parâmetro a seguir.

Truncar

Se os tokens de início ou de fim em uma sentença serão truncados, quando essa sentença exceder o número máximo de tokens permitidos. Por exemplo, uma sentença tem 516 tokens, mas o tamanho máximo do token é 512. Se você optar por truncar o final, os últimos 4 tokens dessa instrução serão cortados.