Cohere Rerank 3.5
Il modello cohere.rerank.v3-5 accetta una query e un elenco di testi e produce un array ordinato con ogni testo assegnato un punteggio di rilevanza. Il punteggio di pertinenza è il modo in cui il modello classifica i documenti, ovvero quanto bene ogni testo corrisponde alla query.
Aree per questo modello
Per le aree supportate, i tipi di endpoint (cluster AI su richiesta o dedicati) e l'hosting (AI generativa OCI o chiamate esterne) per questo modello, vedere la pagina Modelli per area. Per informazioni dettagliate sulle aree, vedere la pagina Aree AI generative.
Accedi al modello
Gli endpoint API per tutte le region commerciali, sovrane e governative supportate sono elencati nei collegamenti API di gestione e API di inferenza. È possibile accedere a ciascun modello solo tramite le aree supportate.
Caratteristiche principali
- Solo modalità dedicata.
- Non disponibile on-demand o nel parco giochi.
- Accedi al modello ospitato su un cluster tramite API e SDK.
- Per la modalità dedicata, creare un endpoint in un cluster AI dedicato in hosting, ospitare il modello nel cluster, quindi eseguire l'API RerankText o il relativo SDK pertinente.
Cluster AI dedicato per il modello
Per raggiungere un modello tramite un cluster AI dedicato in qualsiasi area elencata, devi creare un endpoint per tale modello su un cluster AI dedicato. Per le dimensioni dell'unità cluster corrispondenti a questo modello, vedere la tabella riportata di seguito.
| Modello base | Cluster di ottimizzazione | Cluster di hosting | Informazioni pagina determinazione prezzi | Richiedi aumento limite cluster |
|---|---|---|---|---|
|
Non disponibile per l'ottimizzazione |
|
|
|
Se non si dispone di limiti cluster sufficienti nella tenancy per ospitare il modello Cohere Rerank 3.5 in un cluster AI dedicato, richiedere il limite dedicated-unit-rerank-cohere-count da aumentare di 1.
Regole endpoint per i cluster
- Un cluster AI dedicato può contenere fino a 50 endpoint.
- Utilizzare questi endpoint per creare alias che puntano tutti allo stesso modello base o alla stessa versione di un modello personalizzato, ma non a entrambi i tipi.
- Diversi endpoint per lo stesso modello semplificano l'assegnazione a utenti o scopi diversi.
| Dimensione unità cluster di hosting | Regole endpoint |
|---|---|
| RERANK_COHERE |
|
-
Per aumentare il volume delle chiamate supportato da un cluster di hosting, aumentare il conteggio delle istanze modificando il cluster AI dedicato. Vedere Aggiornamento di un cluster AI dedicato.
-
Per più di 50 endpoint per cluster, richiedere un aumento del limite,
endpoint-per-dedicated-unit-count. Vedere Creazione di una richiesta di aumento del limite e Limiti del servizio per l'intelligenza artificiale generativa.
Benchmark sulle prestazioni del cluster
Esamina i benchmark delle prestazioni del cluster Cohere Rerank 3.5 per scenari diversi.
Date rilascio e smobilizzo
| Modello | Data di rilascio | Data smobilizzo su richiesta | Data smobilizzo modalità dedicata |
|---|---|---|---|
cohere.rerank.v3-5
|
2025-05-14 | La modalità su richiesta non è disponibile per questo modello. | Almeno 6 mesi dopo il rilascio del 1o modello di sostituzione. |
Per un elenco di tutte le linee temporali del modello e dei relativi dettagli, vedere Ritiro dei modelli.
Ricalcola parametro modello
Per i parametri del modello di classificazione, consultare la documentazione dell'API RerankText.