Cohere Rerank 4

Cohere Rerank 4 é um modelo rerank disponível em duas variantes, Pro e Fast.

A nova classificação melhora a relevância da pesquisa ao reordenar um conjunto inicial de resultados recuperados. Depois que uma etapa de recuperação retorna documentos do candidato, o modelo de nova classificação compara a consulta com cada candidato e classifica os resultados do mais relevante para o menos relevante.

O Cohere Rerank 4 oferece suporte a reclassificação multilíngue e conteúdo semiestruturado, incluindo JSON, tabelas e conteúdo semelhante a código.

O que há de novo em Rerank 4

Comparado com o Cohere Rerank 3.5, o Rerank 4 adiciona uma janela de contexto maior, melhor qualidade de reclassificação, suporte de autoaprendizagem e duas variantes otimizadas para diferentes requisitos de carga de trabalho

Maior janela de contexto

O Rerank 4 suporta uma janela de contexto de 32.000 toques. A janela de contexto maior melhora o manuseio de documentos longos e entradas de candidatos maiores, o que é útil para conteúdo corporativo denso, como relatórios, contratos, manuais e documentação técnica.

Melhor qualidade de reclassificação

O Rerank 4 melhora a ordenação de resultados para cargas de trabalho de recuperação empresarial. Ele fornece uma classificação de relevância mais forte para negócios, finanças, conteúdo técnico e outros domínios específicos, o que pode melhorar os fluxos de trabalho de geração aumentados pela recuperação downstream, apresentando um contexto mais relevante.

Suporte de autoaprendizado

O Rerank 4 apresenta o suporte de autoaprendizado, que ajuda a adaptar o comportamento de reclassificação a dados específicos do domínio, terminologia e preferências de relevância sem exigir dados de treinamento anotados.

Variantes Pro e Fast

O Rerank 4 está disponível em duas variantes:

  • O Pro é otimizado para reclassificação de precisão mais alta e tarefas de recuperação mais complexas.
  • O Fast é otimizado para cargas de trabalho de baixa latência e alto rendimento.
Suporte a dados multilíngues e semiestruturados

O Rerank 4 suporta a reclassificação de conteúdos em inglês e não-inglês em mais de 100 idiomas. Ele também suporta conteúdo semiestruturado, incluindo JSON, tabelas e conteúdo semelhante a código.

Regiões para este Modelo

Importante

Para regiões suportadas, tipos de ponto final (clusters de IA sob demanda ou dedicados) e hospedagem (OCI Generative AI ou chamadas externas) para esse modelo, consulte a página Modelos por Região. Para obter detalhes sobre as regiões, consulte a página Regiões de IA Generativa.

Variantes de Modelo

Cohere Rerank 4 inclui as seguintes variantes de modelo:

Modelo Nome do Modelo do OCI Descrição
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Modelo de reavaliação multilíngue para texto em inglês e não em inglês e dados JSON semiestruturados. Mais adequado para cargas de trabalho de reclassificação complexas e com foco na qualidade.
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Modelo de reavaliação multilíngue leve para texto em inglês e não em inglês e dados JSON semiestruturados. Mais adequado para cargas de trabalho de baixa latência e alto rendimento.

Modo sob Demanda

Algumas variantes do Cohere Rerank 4 estão disponíveis sob demanda nas regiões suportadas. O modo sob demanda não requer um cluster de IA dedicado.

Consulte Modelos por Região para verificar quais variantes de modelo estão disponíveis sob demanda e em quais regiões.

Nome do Modelo Nome do Modelo do OCI Nome do Produto da Página de Precificação
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Rerank 4 Pro
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Rerank 4 Fast

O preço é baseado em 1.000 unidades de pesquisa. Consulte a Página de Preços.

Saiba mais sobre o Modo sob Demanda.

Cluster de IA Dedicado para o Modelo

Algumas variantes do Cohere Rerank 4 estão disponíveis por meio de clusters de IA dedicados em regiões suportadas. Esses modelos não estão disponíveis para ajuste fino.

Para o modo dedicado, crie um ponto de extremidade em um cluster dedicado de IA de hospedagem.

Modelo Tamanho da Unidade de Hardware Regiões Disponíveis Aumento do Limite do Cluster de Solicitações
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro, direção) COHERE_A100_80G_X1
  • Leste dos EUA (Ashburn)
  • Oeste dos EUA (Phoenix)
  • Nome do Limite: dedicated-unit-a100-80g-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro, direção) COHERE_H100_X1
  • Leste do Brasil (São Paulo)
  • Centro da Alemanha (Frankfurt)
  • Sul da Índia (Hyderabad)
  • Centro do Japão (Osaka)
  • Sul do Reino Unido (Londres)
  • Centro-Oeste dos EUA (Chicago)
  • Nome do Limite: dedicated-unit-h100-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1
Cohere Rerank 4 Rápido (cohere.rerank-v4.0-fast) COHERE_A100_80G_X1
  • Oeste dos EUA (Phoenix)
  • Nome do Limite: dedicated-unit-a100-80g-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1
Cohere Rerank 4 Rápido (cohere.rerank-v4.0-fast) COHERE_H100_X1
  • Leste do Brasil (São Paulo)
  • Centro da Alemanha (Frankfurt)
  • Sul da Índia (Hyderabad)
  • Centro do Japão (Osaka)
  • Sul do Reino Unido (Londres)
  • Leste dos EUA (Ashburn)
  • Centro-Oeste dos EUA (Chicago)
  • Nome do Limite: dedicated-unit-h100-count
  • Para Hospedagem, Solicitar Aumento do Limite por: 1

Para obter preços, consulte o Estimador de custos e a Página de preços.

Dica

Se a tenancy não tiver limites suficientes para hospedar esses modelos em um cluster de IA dedicado, solicite um aumento de limite para a forma de hardware usada na região de destino. Por exemplo, para hospedar os modelos no Oeste dos EUA (Phoenix), solicite um aumento de 1 para dedicated-unit-a100-80g-count.

Acessar este Modelo

Para usar um modelo Cohere Rerank 4, chame a API RerankText de uma região suportada.

Ponto Final
https://inference.generativeai.{region}.oci.oraclecloud.com
Operação de API
POST /20231130/actions/rerankText

Em RerankTextDetails, para servingMode, defina o atributo servingType com base em como você deseja acessar o modelo:

  • Use ON_DEMAND para um modelo sob demanda em uma região suportada.
  • Use DEDICATED para um modelo hospedado em um ponto final de cluster de IA dedicado.

Para obter detalhes de disponibilidade e configuração, consulte as seções Modo sob Demanda e Cluster de IA Dedicado para o Modelo anteriores.

Parâmetros do Modelo de Reclassificação

Para os parâmetros do modelo Rerank, consulte a documentação da API RerankText.