Cohere Rerank 3.5 (New)
Il modello cohere.rerank.3-5
accetta una query e un elenco di testi e produce un array ordinato con ogni testo assegnato un punteggio di rilevanza. Il punteggio di pertinenza è il modo in cui il modello classifica i documenti, ovvero quanto bene ogni testo corrisponde alla query.
Disponibile in queste aree
- Brasile orientale (San Paolo) (solo cluster AI dedicato)
- Germania centrale (Francoforte) (solo cluster AI dedicato)
- Japan Central (Osaka) (solo cluster AI dedicato)
- Arabia Saudita centrale (Riyadh) (solo cluster AI dedicato)
- Regno Unito meridionale (Londra) (solo cluster AI dedicato)
- US East (Ashburn) (solo cluster AI dedicato)
- Midwest degli Stati Uniti (Chicago) (solo cluster AI dedicato)
Accedi a questo modello
Caratteristiche principali
- Solo modalità dedicata.
- Non disponibile on-demand o nel parco giochi.
- Accedi al modello ospitato su un cluster tramite API e SDK.
- Per la modalità dedicata, creare un endpoint in un cluster AI dedicato in hosting, ospitare il modello nel cluster, quindi eseguire l'API RerankText o il relativo SDK pertinente.
Cluster AI dedicato per il modello
Per raggiungere un modello tramite un cluster AI dedicato in qualsiasi area elencata, devi creare un endpoint per tale modello su un cluster AI dedicato. Per le dimensioni dell'unità cluster corrispondenti a questo modello, vedere la tabella riportata di seguito.
Modello base | Cluster di ottimizzazione | Cluster di hosting | Informazioni pagina determinazione prezzi | Richiedi aumento limite cluster |
---|---|---|---|---|
|
Non disponibile per l'ottimizzazione |
|
|
|
Se non si dispone di limiti cluster sufficienti nella tenancy per ospitare il modello Cohere Rerank 3.5 in un cluster AI dedicato, richiedere il limite dedicated-unit-rerank-cohere-count
da aumentare di 1.
Regole endpoint per i cluster
- Un cluster AI dedicato può contenere fino a 50 endpoint.
- Utilizzare questi endpoint per creare alias che puntano tutti allo stesso modello base o alla stessa versione di un modello personalizzato, ma non a entrambi i tipi.
- Diversi endpoint per lo stesso modello semplificano l'assegnazione a utenti o scopi diversi.
Dimensione unità cluster di hosting | Regole endpoint |
---|---|
RERANK_COHERE |
|
-
Per aumentare il volume delle chiamate supportato da un cluster di hosting, aumentare il conteggio delle istanze modificando il cluster AI dedicato. Vedere Aggiornamento di un cluster AI dedicato.
-
Per più di 50 endpoint per cluster, richiedere un aumento del limite,
endpoint-per-dedicated-unit-count
. Vedere Richiesta di un aumento del limite del servizio e Limiti del servizio per l'intelligenza artificiale generativa.
Benchmark sulle prestazioni del cluster
Esamina i benchmark delle prestazioni del cluster Cohere Rerank 3.5 per scenari diversi.
Date rilascio e smobilizzo
Modello | Data di rilascio | Data smobilizzo su richiesta | Data smobilizzo modalità dedicata |
---|---|---|---|
cohere.rerank.3-5
|
2.025-5-14 | La modalità su richiesta non è disponibile per questo modello. | Almeno 6 mesi dopo il rilascio del 1o modello di sostituzione. |
Per un elenco di tutte le linee temporali del modello e dei relativi dettagli, vedere Ritiro dei modelli.
Ricalcola parametro modello
Per i parametri del modello di classificazione, consultare la documentazione dell'API RerankText.