Cohere Rerank 3.5
O modelo cohere.rerank.v3-5 obtém uma consulta e uma lista de textos e produz um array ordenado com cada texto atribuído a uma pontuação de relevância. A pontuação de relevância é como o modelo classifica os documentos, ou seja, o quão bem cada texto corresponde à consulta.
Regiões para este Modelo
Para regiões suportadas, tipos de ponto final (clusters de IA sob demanda ou dedicados) e hospedagem (OCI Generative AI ou chamadas externas) para esse modelo, consulte a página Modelos por Região. Para obter detalhes sobre as regiões, consulte a página Regiões de IA Generativa.
Acessar este Modelo
Os pontos finais de API para todas as regiões comerciais, soberanas e governamentais suportadas são listados nos links API de Gerenciamento e API de Inferência. Você só pode acessar cada modelo por meio de suas regiões suportadas.
Principais Recursos
- Somente modo dedicado.
- Não disponível sob demanda ou no playground.
- Acesse o modelo hospedado em um cluster por meio da API e do SDK.
- Para o modo dedicado, crie um ponto final em um cluster de IA dedicado de hospedagem, hospede o modelo no cluster e, em seguida, execute a API RerankText ou seu SDK relevante.
Cluster de IA Dedicado para o Modelo
Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.
| Modelo Base | Cluster de Ajuste | Cluster de Hosts | Informações da Página de Preços | Aumento do Limite do Cluster de Solicitações |
|---|---|---|---|---|
|
Não disponível para ajuste fino |
|
|
|
Se você não tiver limites de cluster suficientes em sua tenancy para hospedar o modelo Cohere Rerank 3.5 em um cluster de IA dedicado, solicite que o limite dedicated-unit-rerank-cohere-count aumente em 1.
Regras de Ponto Final para Clusters
- Um cluster de IA dedicado pode conter até 50 pontos finais.
- Use esses pontos finais para criar aliases que todos apontam para o mesmo modelo base ou para a mesma versão de um modelo personalizado, mas não para os dois tipos.
- Vários pontos finais para o mesmo modelo facilitam a designação a diferentes usuários ou propósitos.
| Tamanho da Unidade do Cluster de Hospedagem | Regras de Ponto Final |
|---|---|
| RERANK_COHERE |
|
-
Para aumentar o volume de chamadas suportado por um cluster de hospedagem, aumente sua contagem de instâncias editando o cluster de IA dedicado. Consulte Atualizando um Cluster de IA Dedicado.
-
Para mais de 50 pontos finais por cluster, solicite um aumento para o limite,
endpoint-per-dedicated-unit-count. Consulte Solicitando um Aumento do Limite de Serviço e Limites de Serviço do Serviço Generative AI.
Benchmarks de Desempenho do Cluster
Revise os benchmarks de desempenho do cluster do Cohere Rerank 3.5 para diferentes cenários.
Datas de Liberação e Baixa
| Modelo | Data de Liberação | Data de Aposentadoria Sob Demanda | Data de Baixa do Modo Dedicado |
|---|---|---|---|
cohere.rerank.v3-5
|
2025-05-14 | O modo sob demanda não está disponível para este modelo. | Pelo menos 6 meses após o lançamento do 1o modelo de substituição. |
Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.
Parâmetro do Modelo de Reclassificação
Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.