Cohere Rerank 3.5

Il modello cohere.rerank.v3-5 accetta una query e un elenco di testi e produce un array ordinato con ogni testo assegnato un punteggio di rilevanza. Il punteggio di pertinenza è il modo in cui il modello classifica i documenti, ovvero quanto bene ogni testo corrisponde alla query.

Aree per questo modello

Importante

Per le aree supportate, i tipi di endpoint (cluster AI su richiesta o dedicati) e l'hosting (AI generativa OCI o chiamate esterne) per questo modello, vedere la pagina Modelli per area. Per informazioni dettagliate sulle aree, vedere la pagina Aree AI generative.

Caratteristiche principali

Cluster AI dedicato per il modello

  • Modello disponibile solo attraverso la modalità dedicata. (Non disponibile su richiesta).
  • Per la modalità dedicata, creare un endpoint in un cluster AI dedicato in hosting, ospitare il modello nel cluster, quindi eseguire l'API RerankText o il relativo SDK pertinente.

Per la dimensione dell'unità cluster corrispondente a questo modello, vedere la tabella seguente.

Modello base Cluster di ottimizzazione Cluster di hosting Informazioni pagina determinazione prezzi Richiedi aumento limite cluster
  • Nome modello: Cohere Rerank 3.5
  • Nome modello OCI: cohere.rerank.v3-5
Non disponibile per l'ottimizzazione
  • Dimensione unità: RERANK_COHERE
  • Unità obbligatorie: 1
  • Nome prodotto pagina determinazione prezzi: Cohere Rerank - Dedicated
  • Nome limite: dedicated-unit-rerank-cohere-count
  • Per l'hosting, richiedere l'aumento del limite entro: 1
Suggerimento

Se non si dispone di limiti cluster sufficienti nella tenancy per ospitare il modello Cohere Rerank 3.5 in un cluster AI dedicato, richiedere il limite dedicated-unit-rerank-cohere-count da aumentare di 1.

Regole endpoint per i cluster

  • Un cluster AI dedicato può contenere fino a 50 endpoint.
  • Utilizzare questi endpoint per creare alias che puntano tutti allo stesso modello base o alla stessa versione di un modello personalizzato, ma non a entrambi i tipi.
  • Diversi endpoint per lo stesso modello semplificano l'assegnazione a utenti o scopi diversi.
Dimensione unità cluster di hosting Regole endpoint
RERANK_COHERE
  • Modello di base: per eseguire il modello ⁇ cohere.rerank.v3-5 ⁇ su più endpoint, creare tutti gli endpoint necessari su un cluster RERANK_COHERE (dimensione unità).
  • Modello personalizzato: non è possibile perfezionare ⁇ cohere.rerank.v3-5, quindi non è possibile creare e ospitare modelli personalizzati creati da tale base.
Suggerimento

Benchmark sulle prestazioni del cluster

Esamina i benchmark delle prestazioni del cluster Cohere Rerank 3.5 per scenari diversi.

Ricalcola parametro modello

Per i parametri del modello di classificazione, consultare la documentazione dell'API RerankText.