Cohere Rerank 3.5
Le modèle cohere.rerank.v3-5 prend une requête et une liste de textes et génère un tableau ordonné avec un score de pertinence affecté à chaque texte. Le score de pertinence est la façon dont le modèle classe les documents, c'est-à-dire la façon dont chaque texte correspond à la requête.
Régions pour ce modèle
Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.
Accéder à ce modèle
Les encres d'API répertorient les adresses de toutes les régions commerciales, souveraines et gouvernementales prises en charge.
Principales fonctionnalités
Cluster d'IA dédié pour le modèle
- Modèle disponible uniquement via le mode dédié. (Non disponible à la demande.)
- Pour le mode dédié, créez une adresse sur un cluster d'IA dédié d'hébergement, hébergez le modèle sur le cluster, puis exécutez l'API RerankText ou son kit SDK approprié.
Pour connaître la taille d'unité de cluster correspondant à ce modèle, reportez-vous au tableau suivant.
| Modèle de base | Cluster de réglage fin | Cluster d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de cluster |
|---|---|---|---|---|
|
Non disponible pour le réglage fin |
|
|
|
Si votre location ne dispose pas de suffisamment de limites de cluster pour héberger le modèle Cohere Rerank 3.5 sur un cluster d'IA dédié, demandez une augmentation de 1 de la limite dedicated-unit-rerank-cohere-count.
Règles d'adresse pour les clusters
- Un cluster d'IA dédié peut contenir jusqu'à 50 adresses.
- Utilisez ces adresses pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas les deux types.
- Plusieurs points d'extrémité pour le même modèle facilitent leur affectation à différents utilisateurs ou objectifs.
| Taille de l'unité de cluster d'hébergement | Règles d'adresse |
|---|---|
| RERANK_COHERE |
|
-
Pour augmenter le volume d'appels pris en charge par un cluster d'hébergement, augmentez le nombre d'instances en modifiant le cluster d'IA dédié. Reportez-vous à Mise à jour d'un cluster d'IA dédié.
-
Pour plus de 50 adresses par cluster, demandez une augmentation de la limite,
endpoint-per-dedicated-unit-count. Reportez-vous à Création d'une demande d'augmentation de limite et à Limites de service pour l'IA générative.
Tests de performances du cluster
Consultez les tests d'évaluation des performances du cluster Cohere Rerank 3.5 pour différents scénarios.
Dates de publication et de retrait OCI
Pour les dates de sortie et de sortie et les options de modèle de remplacement, reportez-vous aux pages suivantes en fonction du mode (à la demande ou dédié) :
Dates de déblocage et de sortie
Pour les dates de déblocage et de sortie et les options de modèle de remplacement, reportez-vous à la page suivante :
Paramètre de modèle de reclassement
Pour les paramètres de modèle Rerank, reportez-vous à la documentation de l'API RerankText.