Cohere Rerank 3.5

Le modèle cohere.rerank.v3-5 prend une interrogation et une liste de textes et produit un tableau ordonné avec chaque texte affecté une note de pertinence. La note de pertinence est la façon dont le modèle classe les documents, c'est-à-dire la façon dont chaque texte correspond à la requête.

Principales fonctions

Grappe d'IA dédiée pour le modèle

  • Modèle disponible uniquement via le mode dédié. (Non disponible sur demande.)
  • Pour le mode dédié, créez un point d'extrémité sur une grappe d'IA dédiée d'hébergement, hébergez le modèle sur la grappe, puis exécutez l'API RerankText ou sa trousse SDK pertinente.

Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.

Modèle de base Cluster de réglage fin Grappe d'hébergement Informations sur la page de tarification Demander une augmentation de limite de grappe
  • Nom du modèle : Cohere Rerank 3.5
  • Nom du modèle OCI : cohere.rerank.v3-5
Non disponible pour le réglage fin
  • Taille de l'unité : RERANK_COHERE
  • Unités requises : 1
  • Nom du produit de la page Tarification : Cohere Rerank - Dedicated
  • Nom de la limite : dedicated-unit-rerank-cohere-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Conseil

Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger le modèle Cohere Rerank 3.5 sur une grappe dédiée à l'IA, demandez que la limite dedicated-unit-rerank-cohere-count augmente de 1.

Règles de point d'extrémité pour les grappes

  • Une grappe dédiée à l'IA peut contenir jusqu'à 50 points d'extrémité.
  • Utilisez ces points d'extrémité pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas vers les deux types.
  • Plusieurs points d'extrémité pour le même modèle permettent de les affecter facilement à différents utilisateurs ou objectifs.
Taille d'unité de la grappe d'hébergement Règles de point d'extrémité
RERANK_COHERE
  • Modèle de base : Pour exécuter le modèle cohere.rerank.v3-5  sur plusieurs points d'extrémité, créez autant de points d'extrémité que nécessaire sur une grappe RERANK_COHERE (taille de l'unité).
  • Modèle personnalisé : Vous ne pouvez pas affiner le réglage cohere.rerank.v3-5, vous ne pouvez donc pas créer et héberger des modèles personnalisés créés à partir de cette base.
Conseil

Tests de performance des grappes

Consultez les points de référence de performance de grappe Cohere Rerank 3.5 pour différents scénarios.

Rétablir le paramètre du modèle

Pour connaître les paramètres du modèle Rerank, consultez la documentation sur l'API RerankText.