Cohere Rerank 3.5
O modelo cohere.rerank.v3-5 obtém uma consulta e uma lista de textos e produz um array ordenado com cada texto atribuído a uma pontuação de relevância. A pontuação de relevância é como o modelo classifica os documentos, ou seja, o quão bem cada texto corresponde à consulta.
Regiões para este Modelo
Para regiões suportadas, tipos de ponto final (clusters de IA sob demanda ou dedicados) e hospedagem (OCI Generative AI ou chamadas externas) para esse modelo, consulte a página Modelos por Região. Para obter detalhes sobre as regiões, consulte a página Regiões de IA Generativa.
Acessar este Modelo
As tintas de API listam os pontos finais para todas as regiões comerciais, soberanas e governamentais suportadas.
Principais Recursos
Cluster de IA Dedicado para o Modelo
- Modelo disponível somente através do modo dedicado. (Não disponível sob demanda.)
- Para o modo dedicado, crie um ponto final em um cluster de IA dedicado de hospedagem, hospede o modelo no cluster e, em seguida, execute a API RerankText ou seu SDK relevante.
Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.
| Modelo Base | Cluster de Ajuste | Cluster de Hosts | Informações da Página de Preços | Aumento do Limite do Cluster de Solicitações |
|---|---|---|---|---|
|
Não disponível para ajuste fino |
|
|
|
Se você não tiver limites de cluster suficientes em sua tenancy para hospedar o modelo Cohere Rerank 3.5 em um cluster de IA dedicado, solicite que o limite dedicated-unit-rerank-cohere-count aumente em 1.
Regras de Ponto Final para Clusters
- Um cluster de IA dedicado pode conter até 50 pontos finais.
- Use esses pontos finais para criar aliases que todos apontam para o mesmo modelo base ou para a mesma versão de um modelo personalizado, mas não para os dois tipos.
- Vários pontos finais para o mesmo modelo facilitam a designação a diferentes usuários ou propósitos.
| Tamanho da Unidade do Cluster de Hospedagem | Regras de Ponto Final |
|---|---|
| RERANK_COHERE |
|
-
Para aumentar o volume de chamadas suportado por um cluster de hospedagem, aumente sua contagem de instâncias editando o cluster de IA dedicado. Consulte Atualizando um Cluster de IA Dedicado.
-
Para mais de 50 pontos finais por cluster, solicite um aumento para o limite,
endpoint-per-dedicated-unit-count. Consulte Criando uma Solicitação de Aumento de Limite e Limites do Serviço para IA Generativa.
Benchmarks de Desempenho do Cluster
Revise os benchmarks de desempenho do cluster do Cohere Rerank 3.5 para diferentes cenários.
Datas de Lançamento e Baixa do OCI
Para datas de lançamento e baixa e opções de modelo de substituição, consulte as seguintes páginas com base no modo (sob demanda ou dedicado):
Datas de Liberação e Baixa
Para obter as datas de liberação e baixa e as opções de modelo de substituição, consulte a seguinte página:
Parâmetro do Modelo de Reclassificação
Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.