Cohere Rerank 3.5
Il modello cohere.rerank.v3-5 accetta una query e un elenco di testi e produce un array ordinato con ogni testo assegnato un punteggio di rilevanza. Il punteggio di pertinenza è il modo in cui il modello classifica i documenti, ovvero quanto bene ogni testo corrisponde alla query.
Aree per questo modello
Per le aree supportate, i tipi di endpoint (cluster AI su richiesta o dedicati) e l'hosting (AI generativa OCI o chiamate esterne) per questo modello, vedere la pagina Modelli per area. Per informazioni dettagliate sulle aree, vedere la pagina Aree AI generative.
Accedi al modello
Gli inchiostri API elencano gli endpoint per tutte le region commerciali, sovrane e governative supportate.
Caratteristiche principali
Cluster AI dedicato per il modello
- Modello disponibile solo attraverso la modalità dedicata. (Non disponibile su richiesta).
- Per la modalità dedicata, creare un endpoint in un cluster AI dedicato in hosting, ospitare il modello nel cluster, quindi eseguire l'API RerankText o il relativo SDK pertinente.
Per la dimensione dell'unità cluster corrispondente a questo modello, vedere la tabella seguente.
| Modello base | Cluster di ottimizzazione | Cluster di hosting | Informazioni pagina determinazione prezzi | Richiedi aumento limite cluster |
|---|---|---|---|---|
|
Non disponibile per l'ottimizzazione |
|
|
|
Se non si dispone di limiti cluster sufficienti nella tenancy per ospitare il modello Cohere Rerank 3.5 in un cluster AI dedicato, richiedere il limite dedicated-unit-rerank-cohere-count da aumentare di 1.
Regole endpoint per i cluster
- Un cluster AI dedicato può contenere fino a 50 endpoint.
- Utilizzare questi endpoint per creare alias che puntano tutti allo stesso modello base o alla stessa versione di un modello personalizzato, ma non a entrambi i tipi.
- Diversi endpoint per lo stesso modello semplificano l'assegnazione a utenti o scopi diversi.
| Dimensione unità cluster di hosting | Regole endpoint |
|---|---|
| RERANK_COHERE |
|
-
Per aumentare il volume delle chiamate supportato da un cluster di hosting, aumentare il conteggio delle istanze modificando il cluster AI dedicato. Vedere Aggiornamento di un cluster AI dedicato.
-
Per più di 50 endpoint per cluster, richiedere un aumento del limite,
endpoint-per-dedicated-unit-count. Vedere Creazione di una richiesta di aumento del limite e Limiti del servizio per l'intelligenza artificiale generativa.
Benchmark sulle prestazioni del cluster
Esamina i benchmark delle prestazioni del cluster Cohere Rerank 3.5 per scenari diversi.
Date di rilascio e ritiro OCI
Per le date di rilascio e ritiro e le opzioni del modello di sostituzione, vedere le seguenti pagine in base alla modalità (on-demand o dedicata):
Date rilascio e smobilizzo
Per le date di rilascio e ritiro e le opzioni del modello di sostituzione, vedere la pagina seguente:
Ricalcola parametro modello
Per i parametri del modello di classificazione, consultare la documentazione dell'API RerankText.