Cohere Rerank 3.5 (Deprecated)

O modelo cohere.rerank.v3-5 obtém uma consulta e uma lista de textos e produz um array ordenado com cada texto atribuído a uma pontuação de relevância. A pontuação de relevância é como o modelo classifica os documentos, ou seja, o quão bem cada texto corresponde à consulta.

Regiões para este Modelo

Importante

Para regiões suportadas, tipos de ponto final (clusters de IA sob demanda ou dedicados) e hospedagem (OCI Generative AI ou chamadas externas) para esse modelo, consulte a página Modelos por Região. Para obter detalhes sobre as regiões, consulte a página Regiões de IA Generativa.

Acessar este Modelo

Você pode acessar esse modelo por meio de:

Observação

As tintas de API listam os pontos finais para todas as regiões comerciais, soberanas e governamentais suportadas.

Principais Recursos

Cluster de IA Dedicado para o Modelo

Modelo disponível somente através do modo dedicado. (Não disponível sob demanda.)
Para o modo dedicado, crie um ponto final em um cluster de IA dedicado de hospedagem, hospede o modelo no cluster e, em seguida, execute a API RerankText ou seu SDK relevante.

Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.


Modelo Base	Cluster de Ajuste	Cluster de Hosts	Informações da Página de Preços	Aumento do Limite do Cluster de Solicitações
Nome do Modelo: Cohere Rerank 3.5 Nome do Modelo do OCI: `cohere.rerank.v3-5`	Não disponível para ajuste fino	Tamanho da Unidade: RERANK_COHERE Unidades Obrigatórias: 1	Nome do produto da página de preços: Cohere Rerank - Dedicated	Nome do Limite: `dedicated-unit-rerank-cohere-count` Para Hospedagem, Solicitar Aumento do Limite por: 1

Dica

Se você não tiver limites de cluster suficientes em sua tenancy para hospedar o modelo Cohere Rerank 3.5 em um cluster de IA dedicado, solicite que o limite dedicated-unit-rerank-cohere-count aumente em 1.

Regras de Ponto Final para Clusters

Um cluster de IA dedicado pode conter até 50 pontos finais.
Use esses pontos finais para criar aliases que todos apontam para o mesmo modelo base ou para a mesma versão de um modelo personalizado, mas não para os dois tipos.
Vários pontos finais para o mesmo modelo facilitam a designação a diferentes usuários ou propósitos.


Tamanho da Unidade do Cluster de Hospedagem	Regras de Ponto Final
RERANK_COHERE	Modelo base: Para executar o modelo `cohere.rerank.v3-5` ⁇ em vários pontos finais, crie quantos pontos finais forem necessários em um cluster RERANK_COHERE (tamanho unitário). Custom model (Modelo personalizado): não é possível ajustar `cohere.rerank.v3-5`; portanto, não é possível criar e hospedar modelos personalizados criados nessa base.

Dica

Para aumentar o volume de chamadas suportado por um cluster de hospedagem, aumente sua contagem de instâncias editando o cluster de IA dedicado. Consulte Atualizando um Cluster de IA Dedicado.
Para mais de 50 pontos finais por cluster, solicite um aumento para o limite, endpoint-per-dedicated-unit-count. Consulte Criando uma Solicitação de Aumento de Limite e Limites do Serviço para IA Generativa.

Benchmarks de Desempenho do Cluster

Revise os benchmarks de desempenho do cluster do Cohere Rerank 3.5 para diferentes cenários.

Datas de Lançamento e Baixa do OCI

Para datas de lançamento e baixa e opções de modelo de substituição, consulte as seguintes páginas com base no modo (sob demanda ou dedicado):

Datas de Liberação e Baixa

Para obter as datas de liberação e baixa e as opções de modelo de substituição, consulte a seguinte página:

Datas de Baixa do Modelo (Modo Dedicado)

Parâmetro do Modelo de Reclassificação

Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.

Documentação do Oracle Cloud Infrastructure