Cohere Rerank 3.5
O modelo cohere.rerank.v3-5
obtém uma consulta e uma lista de textos e produz um array ordenado com cada texto atribuído a uma pontuação de relevância. A pontuação de relevância é como o modelo classifica os documentos, ou seja, o quão bem cada texto corresponde à consulta.
Disponível nestas regiões comerciais
- Leste do Brasil (São Paulo) (somente cluster de IA dedicado)
- Centro da Alemanha (Frankfurt) (somente cluster de IA dedicado)
- Centro do Japão (Osaka) (somente cluster de IA dedicado)
- Centro da Arábia Saudita (Riad) (somente cluster de IA dedicado)
- Sul do Reino Unido (Londres) (somente cluster de IA dedicado)
- Leste dos EUA (Ashburn) (somente cluster de IA dedicado)
- Centro-Oeste dos EUA (Chicago) (somente cluster de IA dedicado)
Disponível nesta região soberana
Esse modelo está disponível no EU Sovereign Central (Frankfurt) (somente cluster de IA dedicado) por meio dos seguintes pontos finais de API:
- API de inferência:
https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu
- API de Gerenciamento:
https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu
Na API, para o nome do modelo e o OCID do modelo, use cohere.rerank.v3-5
.
Saiba mais sobre a Oracle EU Sovereign Cloud.
Acessar este Modelo
Principais Recursos
- Somente modo dedicado.
- Não disponível sob demanda ou no playground.
- Acesse o modelo hospedado em um cluster por meio da API e do SDK.
- Para o modo dedicado, crie um ponto final em um cluster de IA dedicado de hospedagem, hospede o modelo no cluster e, em seguida, execute a API RerankText ou seu SDK relevante.
Cluster de IA Dedicado para o Modelo
Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.
Modelo Base | Cluster de Ajuste | Cluster de Hosts | Informações da Página de Preços | Aumento do Limite do Cluster de Solicitações |
---|---|---|---|---|
|
Não disponível para ajuste fino |
|
|
|
Se você não tiver limites de cluster suficientes em sua tenancy para hospedar o modelo Cohere Rerank 3.5 em um cluster de IA dedicado, solicite que o limite dedicated-unit-rerank-cohere-count
aumente em 1.
Regras de Ponto Final para Clusters
- Um cluster de IA dedicado pode conter até 50 pontos finais.
- Use esses pontos finais para criar aliases que todos apontam para o mesmo modelo base ou para a mesma versão de um modelo personalizado, mas não para os dois tipos.
- Vários pontos finais para o mesmo modelo facilitam a designação a diferentes usuários ou propósitos.
Tamanho da Unidade do Cluster de Hospedagem | Regras de Ponto Final |
---|---|
RERANK_COHERE |
|
-
Para aumentar o volume de chamadas suportado por um cluster de hospedagem, aumente sua contagem de instâncias editando o cluster de IA dedicado. Consulte Atualizando um Cluster de IA Dedicado.
-
Para mais de 50 pontos finais por cluster, solicite um aumento para o limite,
endpoint-per-dedicated-unit-count
. Consulte Solicitando um Aumento do Limite de Serviço e Limites de Serviço do Serviço Generative AI.
Benchmarks de Desempenho do Cluster
Revise os benchmarks de desempenho do cluster do Cohere Rerank 3.5 para diferentes cenários.
Datas de Liberação e Baixa
Modelo | Data de Liberação | Data de Aposentadoria Sob Demanda | Data de Baixa do Modo Dedicado |
---|---|---|---|
cohere.rerank.v3-5
|
2,025-5-14 | O modo sob demanda não está disponível para este modelo. | Pelo menos 6 meses após o lançamento do 1o modelo de substituição. |
Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.
Parâmetro do Modelo de Reclassificação
Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.