Cohere Rerank 3.5 (New)
Il modello cohere.rerank.3-5
accetta una query e un elenco di testi e produce un array ordinato con ogni testo assegnato un punteggio di rilevanza. Il punteggio di pertinenza è il modo in cui il modello classifica i documenti, ovvero quanto bene ogni testo corrisponde alla query.
Disponibile in queste aree
- Brasile orientale (San Paolo) (solo cluster AI dedicato)
- Germania centrale (Francoforte) (solo cluster AI dedicato)
- Japan Central (Osaka) (solo cluster AI dedicato)
- Arabia Saudita centrale (Riyadh) (solo cluster AI dedicato)
- Regno Unito meridionale (Londra) (solo cluster AI dedicato)
- US East (Ashburn) (solo cluster AI dedicato)
- Midwest degli Stati Uniti (Chicago) (solo cluster AI dedicato)
Caratteristiche principali
- Solo modalità dedicata.
- Non disponibile on-demand o nel parco giochi.
- Accedi al modello ospitato su un cluster tramite API e SDK.
- Per la modalità dedicata, creare un endpoint in un cluster AI dedicato in hosting, ospitare il modello nel cluster, quindi eseguire l'API RerankText o il relativo SDK pertinente.
Cluster AI dedicato per il modello
Per raggiungere un modello tramite un cluster AI dedicato in qualsiasi area elencata, devi creare un endpoint per tale modello su un cluster AI dedicato. Per le dimensioni dell'unità cluster corrispondenti a questo modello, vedere la tabella riportata di seguito.
Modello base | Cluster di ottimizzazione | Cluster di hosting | Informazioni pagina determinazione prezzi | Richiedi aumento limite cluster |
---|---|---|---|---|
|
Non disponibile per l'ottimizzazione |
|
|
|
-
Se non si dispone di limiti cluster sufficienti nella tenancy per ospitare il modello Cohere Rerank 3.5 in un cluster AI dedicato, richiedere il limite
dedicated-unit-rerank-cohere-count
da aumentare di 1. - Esamina i benchmark delle prestazioni del cluster Cohere Rerank 3.5 per scenari diversi.
Date rilascio e smobilizzo
Modello | Data di rilascio | Data smobilizzo su richiesta | Data smobilizzo modalità dedicata |
---|---|---|---|
cohere.rerank.3-5
|
2.025-5-14 | L'opzione su richiesta non è disponibile per questo modello. | Almeno 6 mesi dopo il rilascio del 1o modello di sostituzione. |
Per un elenco di tutte le linee temporali del modello e dei relativi dettagli, vedere Ritiro dei modelli.
Ricalcola parametro modello
Per i parametri del modello di classificazione, consultare la documentazione dell'API RerankText.