Cohere Rerank 4
Cohere Rerank 4 é um modelo rerank disponível em duas variantes, Pro e Fast.
A nova classificação melhora a relevância da pesquisa ao reordenar um conjunto inicial de resultados recuperados. Depois que uma etapa de recuperação retorna documentos do candidato, o modelo de nova classificação compara a consulta com cada candidato e classifica os resultados do mais relevante para o menos relevante.
O Cohere Rerank 4 oferece suporte a reclassificação multilíngue e conteúdo semiestruturado, incluindo JSON, tabelas e conteúdo semelhante a código.
O que há de novo em Rerank 4
Comparado com o Cohere Rerank 3.5, o Rerank 4 adiciona uma janela de contexto maior, melhor qualidade de reclassificação, suporte de autoaprendizagem e duas variantes otimizadas para diferentes requisitos de carga de trabalho
- Maior janela de contexto
-
O Rerank 4 suporta uma janela de contexto de 32.000 toques. A janela de contexto maior melhora o manuseio de documentos longos e entradas de candidatos maiores, o que é útil para conteúdo corporativo denso, como relatórios, contratos, manuais e documentação técnica.
- Melhor qualidade de reclassificação
-
O Rerank 4 melhora a ordenação de resultados para cargas de trabalho de recuperação empresarial. Ele fornece uma classificação de relevância mais forte para negócios, finanças, conteúdo técnico e outros domínios específicos, o que pode melhorar os fluxos de trabalho de geração aumentados pela recuperação downstream, apresentando um contexto mais relevante.
- Suporte de autoaprendizado
-
O Rerank 4 apresenta o suporte de autoaprendizado, que ajuda a adaptar o comportamento de reclassificação a dados específicos do domínio, terminologia e preferências de relevância sem exigir dados de treinamento anotados.
- Variantes Pro e Fast
-
O Rerank 4 está disponível em duas variantes:
- O Pro é otimizado para reclassificação de precisão mais alta e tarefas de recuperação mais complexas.
- O Fast é otimizado para cargas de trabalho de baixa latência e alto rendimento.
- Suporte a dados multilíngues e semiestruturados
-
O Rerank 4 suporta a reclassificação de conteúdos em inglês e não-inglês em mais de 100 idiomas. Ele também suporta conteúdo semiestruturado, incluindo JSON, tabelas e conteúdo semelhante a código.
Regiões para este Modelo
Para regiões suportadas, tipos de ponto final (clusters de IA sob demanda ou dedicados) e hospedagem (OCI Generative AI ou chamadas externas) para esse modelo, consulte a página Modelos por Região. Para obter detalhes sobre as regiões, consulte a página Regiões de IA Generativa.
Variantes de Modelo
Cohere Rerank 4 inclui as seguintes variantes de modelo:
| Modelo | Nome do Modelo do OCI | Descrição |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Modelo de reavaliação multilíngue para texto em inglês e não em inglês e dados JSON semiestruturados. Mais adequado para cargas de trabalho de reclassificação complexas e com foco na qualidade. |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Modelo de reavaliação multilíngue leve para texto em inglês e não em inglês e dados JSON semiestruturados. Mais adequado para cargas de trabalho de baixa latência e alto rendimento. |
Modo sob Demanda
Algumas variantes do Cohere Rerank 4 estão disponíveis sob demanda nas regiões suportadas. O modo sob demanda não requer um cluster de IA dedicado.
Consulte Modelos por Região para verificar quais variantes de modelo estão disponíveis sob demanda e em quais regiões.
| Nome do Modelo | Nome do Modelo do OCI | Nome do Produto da Página de Precificação |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Rerank 4 Pro |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Rerank 4 Fast |
O preço é baseado em 1.000 unidades de pesquisa. Consulte a Página de Preços.
Saiba mais sobre o Modo sob Demanda.
Cluster de IA Dedicado para o Modelo
Algumas variantes do Cohere Rerank 4 estão disponíveis por meio de clusters de IA dedicados em regiões suportadas. Esses modelos não estão disponíveis para ajuste fino.
Para o modo dedicado, crie um ponto de extremidade em um cluster dedicado de IA de hospedagem.
| Modelo | Tamanho da Unidade de Hardware | Regiões Disponíveis | Aumento do Limite do Cluster de Solicitações |
|---|---|---|---|
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro, direção) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro, direção) |
COHERE_H100_X1 |
|
|
Cohere Rerank 4 Rápido (cohere.rerank-v4.0-fast) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Rápido (cohere.rerank-v4.0-fast) |
COHERE_H100_X1 |
|
|
Para obter preços, consulte o Estimador de custos e a Página de preços.
Se a tenancy não tiver limites suficientes para hospedar esses modelos em um cluster de IA dedicado, solicite um aumento de limite para a forma de hardware usada na região de destino. Por exemplo, para hospedar os modelos no Oeste dos EUA (Phoenix), solicite um aumento de 1 para dedicated-unit-a100-80g-count.
Acessar este Modelo
Para usar um modelo Cohere Rerank 4, chame a API RerankText de uma região suportada.
- Ponto Final
https://inference.generativeai.{region}.oci.oraclecloud.com- Operação de API
POST /20231130/actions/rerankText
Em RerankTextDetails, para servingMode, defina o atributo servingType com base em como você deseja acessar o modelo:
- Use
ON_DEMANDpara um modelo sob demanda em uma região suportada. - Use
DEDICATEDpara um modelo hospedado em um ponto final de cluster de IA dedicado.
Para obter detalhes de disponibilidade e configuração, consulte as seções Modo sob Demanda e Cluster de IA Dedicado para o Modelo anteriores.
Datas de Lançamento e Baixa do OCI
Para datas de lançamento e baixa e opções de modelo de substituição, consulte as seguintes páginas com base no modo (sob demanda ou dedicado):
Parâmetros do Modelo de Reclassificação
Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.