Cohere Rerank 3.5

O modelo cohere.rerank.v3-5 obtém uma consulta e uma lista de textos e produz um array ordenado com cada texto atribuído a uma pontuação de relevância. A pontuação de relevância é como o modelo classifica os documentos, ou seja, o quão bem cada texto corresponde à consulta.

Disponível nestas regiões comerciais

  • Leste do Brasil (São Paulo) (somente cluster de IA dedicado)
  • Centro da Alemanha (Frankfurt) (somente cluster de IA dedicado)
  • Centro do Japão (Osaka) (somente cluster de IA dedicado)
  • Centro da Arábia Saudita (Riad) (somente cluster de IA dedicado)
  • Sul do Reino Unido (Londres) (somente cluster de IA dedicado)
  • Leste dos EUA (Ashburn) (somente cluster de IA dedicado)
  • Centro-Oeste dos EUA (Chicago) (somente cluster de IA dedicado)

Disponível nesta região soberana

Esse modelo está disponível no EU Sovereign Central (Frankfurt) (somente cluster de IA dedicado) por meio dos seguintes pontos finais de API:

  • API de inferência:

    https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu

  • API de Gerenciamento:

    https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu

Na API, para o nome do modelo e o OCID do modelo, use cohere.rerank.v3-5.

Saiba mais sobre a Oracle EU Sovereign Cloud.

Principais Recursos

  • Somente modo dedicado.
  • Não disponível sob demanda ou no playground.
  • Acesse o modelo hospedado em um cluster por meio da API e do SDK.
  • Para o modo dedicado, crie um ponto final em um cluster de IA dedicado de hospedagem, hospede o modelo no cluster e, em seguida, execute a API RerankText ou seu SDK relevante.

Cluster de IA Dedicado para o Modelo

Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.

Modelo Base Cluster de Ajuste Cluster de Hosts Informações da Página de Preços Aumento do Limite do Cluster de Solicitações
  • Nome do Modelo: Cohere Rerank 3.5
  • Nome do Modelo do OCI: cohere.rerank.v3-5
Não disponível para ajuste fino
  • Tamanho da Unidade: RERANK_COHERE
  • Unidades Obrigatórias: 1
  • Nome do produto da página de preços: Cohere Rerank - Dedicated
  • Nome do Limite: dedicated-unit-rerank-cohere-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1
Dica

Se você não tiver limites de cluster suficientes em sua tenancy para hospedar o modelo Cohere Rerank 3.5 em um cluster de IA dedicado, solicite que o limite dedicated-unit-rerank-cohere-count aumente em 1.

Regras de Ponto Final para Clusters

  • Um cluster de IA dedicado pode conter até 50 pontos finais.
  • Use esses pontos finais para criar aliases que todos apontam para o mesmo modelo base ou para a mesma versão de um modelo personalizado, mas não para os dois tipos.
  • Vários pontos finais para o mesmo modelo facilitam a designação a diferentes usuários ou propósitos.
Tamanho da Unidade do Cluster de Hospedagem Regras de Ponto Final
RERANK_COHERE
  • Modelo base: Para executar o modelo cohere.rerank.v3-5 ⁇ em vários pontos finais, crie quantos pontos finais forem necessários em um cluster RERANK_COHERE (tamanho unitário).
  • Custom model (Modelo personalizado): não é possível ajustar cohere.rerank.v3-5; portanto, não é possível criar e hospedar modelos personalizados criados nessa base.
Dica

Benchmarks de Desempenho do Cluster

Revise os benchmarks de desempenho do cluster do Cohere Rerank 3.5 para diferentes cenários.

Datas de Liberação e Baixa

Modelo Data de Liberação Data de Aposentadoria Sob Demanda Data de Baixa do Modo Dedicado
cohere.rerank.v3-5 2,025-5-14 O modo sob demanda não está disponível para este modelo. Pelo menos 6 meses após o lançamento do 1o modelo de substituição.
Importante

Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.

Parâmetro do Modelo de Reclassificação

Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.