Cohere Rerank 3.5 (New)

O modelo cohere.rerank.3-5 obtém uma consulta e uma lista de textos e produz um array ordenado com cada texto atribuído a uma pontuação de relevância. A pontuação de relevância é como o modelo classifica os documentos, ou seja, o quão bem cada texto corresponde à consulta.

Disponível nestas regiões

  • Leste do Brasil (São Paulo) (somente cluster de IA dedicado)
  • Centro da Alemanha (Frankfurt) (somente cluster de IA dedicado)
  • Centro do Japão (Osaka) (somente cluster de IA dedicado)
  • Centro da Arábia Saudita (Riad) (somente cluster de IA dedicado)
  • Sul do Reino Unido (Londres) (somente cluster de IA dedicado)
  • Leste dos EUA (Ashburn) (somente cluster de IA dedicado)
  • Centro-Oeste dos EUA (Chicago) (somente cluster de IA dedicado)

Principais Recursos

  • Somente modo dedicado.
  • Não disponível sob demanda ou no playground.
  • Acesse o modelo hospedado em um cluster por meio da API e do SDK.
  • Para o modo dedicado, crie um ponto final em um cluster de IA dedicado de hospedagem, hospede o modelo no cluster e, em seguida, execute a API RerankText ou seu SDK relevante.

Cluster de IA Dedicado para o Modelo

Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.

Modelo Base Cluster de Ajuste Cluster de Hosts Informações da Página de Preços Aumento do Limite do Cluster de Solicitações
  • Nome do Modelo: Cohere Rerank 3.5
  • Nome do Modelo do OCI: cohere.rerank.3-5
Não disponível para ajuste fino
  • Tamanho da Unidade: RERANK_COHERE
  • Unidades Obrigatórias: 1
  • Nome do produto da página de preços: Cohere Rerank - Dedicated
  • Nome do Limite: dedicated-unit-rerank-cohere-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1
Dica

  • Se você não tiver limites de cluster suficientes em sua tenancy para hospedar o modelo Cohere Rerank 3.5 em um cluster de IA dedicado, solicite que o limite dedicated-unit-rerank-cohere-count aumente em 1.

  • Revise os benchmarks de desempenho do cluster do Cohere Rerank 3.5 para diferentes cenários.

Datas de Liberação e Baixa

Modelo Data de Liberação Data de Aposentadoria Sob Demanda Data de Baixa do Modo Dedicado
cohere.rerank.3-5 2,025-5-14 A opção sob demanda não está disponível para este modelo. Pelo menos 6 meses após o lançamento do 1o modelo de substituição.
Importante

Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.

Parâmetro do Modelo de Reclassificação

Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.