Cohere Rerank 3.5
Le modèle cohere.rerank.v3-5 prend une interrogation et une liste de textes et produit un tableau ordonné avec chaque texte affecté une note de pertinence. La note de pertinence est la façon dont le modèle classe les documents, c'est-à-dire la façon dont chaque texte correspond à la requête.
Régions pour ce modèle
Pour les régions prises en charge, les types de point d'extrémité (grappes d'IA sur demande ou dédiées) et l'hébergement (IA générative pour OCI ou appels externes) pour ce modèle, voir la page Modèles par région. Pour plus de détails sur les régions, consultez la page Régions du service d'intelligence artificielle générative.
Accéder à ce modèle
Les encres d'API listent les points d'extrémité pour toutes les régions commerciales, souveraines et gouvernementales prises en charge.
Principales fonctions
Grappe d'IA dédiée pour le modèle
- Modèle disponible uniquement via le mode dédié. (Non disponible sur demande.)
- Pour le mode dédié, créez un point d'extrémité sur une grappe d'IA dédiée d'hébergement, hébergez le modèle sur la grappe, puis exécutez l'API RerankText ou sa trousse SDK pertinente.
Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.
| Modèle de base | Cluster de réglage fin | Grappe d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de grappe |
|---|---|---|---|---|
|
Non disponible pour le réglage fin |
|
|
|
Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger le modèle Cohere Rerank 3.5 sur une grappe dédiée à l'IA, demandez que la limite dedicated-unit-rerank-cohere-count augmente de 1.
Règles de point d'extrémité pour les grappes
- Une grappe dédiée à l'IA peut contenir jusqu'à 50 points d'extrémité.
- Utilisez ces points d'extrémité pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas vers les deux types.
- Plusieurs points d'extrémité pour le même modèle permettent de les affecter facilement à différents utilisateurs ou objectifs.
| Taille d'unité de la grappe d'hébergement | Règles de point d'extrémité |
|---|---|
| RERANK_COHERE |
|
-
Pour augmenter le volume d'appels pris en charge par une grappe d'hébergement, augmentez le nombre d'instances en modifiant la grappe dédiée à l'IA. Voir Mise à jour d'une grappe d'intelligence artificielle dédiée.
-
Pour plus de 50 points d'extrémité par grappe, demandez une augmentation de la limite,
endpoint-per-dedicated-unit-count. Voir Création d'une demande d'augmentation de limite et Limites de service pour l'intelligence artificielle générative.
Tests de performance des grappes
Consultez les points de référence de performance de grappe Cohere Rerank 3.5 pour différents scénarios.
Dates de version et de mise hors service OCI
Pour connaître les dates de sortie et de mise hors service et les options de modèle de remplacement, consultez les pages suivantes en fonction du mode (sur demande ou dédié) :
Dates de lancement et de mise hors service
Pour connaître les dates de libération et de mise hors service et les options du modèle de remplacement, consultez la page suivante :
Rétablir le paramètre du modèle
Pour connaître les paramètres du modèle Rerank, consultez la documentation sur l'API RerankText.