Cohere Rerank 4

Cohere Rerank 4 è un modello di rerank disponibile in due varianti, Pro e Fast.

La nuova classificazione migliora la pertinenza della ricerca riordinando un set iniziale di risultati recuperati. Dopo che un passo di recupero restituisce i documenti dei candidati, il modello di riclassificazione confronta la query con ogni candidato e classifica i risultati dal più pertinente al meno pertinente.

Cohere Rerank 4 supporta il reranking multilingue e contenuti semi-strutturati, tra cui JSON, tabelle e contenuti simili al codice.

Novità in Rerank 4

Rispetto a Cohere Rerank 3.5, Rerank 4 aggiunge una finestra di contesto più ampia, una qualità di reranking migliorata, il supporto ad autoapprendimento e due varianti ottimizzate per i diversi requisiti del carico di lavoro

Finestra contestuale aumentata

Rerank 4 supporta una finestra di contesto da 32.000 token. La finestra di contesto più ampia migliora la gestione di documenti lunghi e input dei candidati più grandi, il che è utile per contenuti aziendali completi come report, contratti, manuali e documentazione tecnica.

Migliore qualità di reranking

Rerank 4 migliora l'ordinazione dei risultati per i carichi di lavoro di recupero aziendali. Fornisce una classificazione di rilevanza più solida per i contenuti aziendali, finanziari, tecnici e di altro tipo specifici del dominio, che possono migliorare i flussi di lavoro di retrieval-augmented generation a valle emergendo un contesto più pertinente.

Supporto per l'autoapprendimento

Rerank 4 introduce il supporto di autoapprendimento, che aiuta ad adattare il comportamento di ri-classificazione a dati, terminologia e preferenze di pertinenza specifici del dominio senza richiedere dati di formazione annotati.

Varianti Pro e Fast

Rerank 4 è disponibile in due varianti:

  • Pro è ottimizzato per la ridefinizione della precisione più elevata e per task di recupero più complessi.
  • Fast è ottimizzato per carichi di lavoro a latenza inferiore e con throughput più elevato.
Supporto dati multilingue e semi-strutturato

Rerank 4 supporta il reranking per contenuti in inglese e non in inglese in più di 100 lingue. Supporta anche contenuti semi-strutturati, tra cui JSON, tabelle e contenuti simili al codice.

Aree per questo modello

Importante

Per le aree supportate, i tipi di endpoint (cluster AI su richiesta o dedicati) e l'hosting (AI generativa OCI o chiamate esterne) per questo modello, vedere la pagina Modelli per area. Per informazioni dettagliate sulle aree, vedere la pagina Aree AI generative.

Varianti modello

Cohere Rerank 4 include le seguenti varianti di modello:

Modello Nome modello OCI Descrizione
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Modello di reranking multilingue per testo in inglese e non in inglese e dati JSON semistrutturati. Ideale per carichi di lavoro di rianking complessi e incentrati sulla qualità.
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Modello di ri-classificazione multilingue leggero per testo inglese e non inglese e dati JSON semi-strutturati. Ideale per carichi di lavoro a latenza inferiore e con throughput più elevato.

Modalità su richiesta

Alcune varianti di Cohere Rerank 4 sono disponibili on-demand nelle aree supportate. La modalità on-demand non richiede un cluster AI dedicato.

Vedere Modelli per area per verificare quali varianti di modello sono disponibili su richiesta e in quali aree.

Nome modello Nome modello OCI Nome prodotto pagina determinazione prezzi
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Rerank 4 Pro
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Rerank 4 Fast

La determinazione dei prezzi si basa su 1.000 unità di ricerca. Vedere la pagina Determinazione prezzi.

Informazioni sulla modalità On-Demand.

Cluster AI dedicato per il modello

Alcune varianti di Cohere Rerank 4 sono disponibili tramite cluster AI dedicati nelle aree supportate. Questi modelli non sono disponibili per l'ottimizzazione.

Per la modalità dedicata, creare un endpoint su un cluster AI dedicato in hosting.

Modello Dimensione unità hardware Regioni disponibili Richiedi aumento limite cluster
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) COHERE_A100_80G_X1
  • Stati Uniti (Est) - Ashburn
  • Stati Uniti (Ovest) - Phoenix
  • Nome limite: dedicated-unit-a100-80g-count
  • Per l'hosting, richiedere l'aumento del limite entro: 1
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) COHERE_H100_X1
  • Brasile (Est) - San Paolo
  • Germania (Centro) - Francoforte
  • India (Sud) - Hyderabad
  • Giappone centrale (Osaka)
  • Regno Unito (Sud) - Londra
  • Stati Uniti (Midwest) - Chicago
  • Nome limite: dedicated-unit-h100-count
  • Per l'hosting, richiedere l'aumento del limite entro: 1
Rerank Cohere 4 veloce (cohere.rerank-v4.0-fast) COHERE_A100_80G_X1
  • Stati Uniti (Ovest) - Phoenix
  • Nome limite: dedicated-unit-a100-80g-count
  • Per l'hosting, richiedere l'aumento del limite entro: 1
Rerank Cohere 4 veloce (cohere.rerank-v4.0-fast) COHERE_H100_X1
  • Brasile (Est) - San Paolo
  • Germania (Centro) - Francoforte
  • India (Sud) - Hyderabad
  • Giappone centrale (Osaka)
  • Regno Unito (Sud) - Londra
  • Stati Uniti (Est) - Ashburn
  • Stati Uniti (Midwest) - Chicago
  • Nome limite: dedicated-unit-h100-count
  • Per l'hosting, richiedere l'aumento del limite entro: 1

Per la determinazione dei prezzi, vedere Stima dei costi e Pagina Determinazione prezzi.

Suggerimento

Se la tenancy non dispone di limiti sufficienti per ospitare questi modelli in un cluster AI dedicato, richiedere un aumento del limite per la forma hardware utilizzata nell'area di destinazione. Ad esempio, per ospitare i modelli negli Stati Uniti occidentali (Phoenix), richiedere un aumento di 1 per dedicated-unit-a100-80g-count.

Accedi a questo modello

Per utilizzare un modello Cohere Rerank 4, chiamare l'API RerankText da un'area supportata.

Endpoint
https://inference.generativeai.{region}.oci.oraclecloud.com
Operazione API
POST /20231130/actions/rerankText

In RerankTextDetails, per servingMode, impostare l'attributo servingType in base a come si desidera accedere al modello:

  • Utilizzare ON_DEMAND per un modello su richiesta in un'area supportata.
  • Utilizzare DEDICATED per un modello ospitato su un endpoint cluster AI dedicato.

Per informazioni sulla disponibilità e sull'impostazione, vedere le sezioni Modalità su richiesta e Cluster AI dedicato per il modello precedenti.

Ricalcola parametri modello

Per i parametri del modello di riassegnazione, consultare la documentazione dell'API RerankText.