Cohere Rerank 3.5
Le modèle cohere.rerank.v3-5
prend une interrogation et une liste de textes et produit un tableau ordonné avec chaque texte affecté une note de pertinence. La note de pertinence est la façon dont le modèle classe les documents, c'est-à-dire la façon dont chaque texte correspond à la requête.
Disponible dans ces régions commerciales
- Brésil - Est (Sao Paulo) (grappe dédiée à l'IA uniquement)
- Allemagne - Centre (Francfort) (grappe dédiée à l'IA uniquement)
- Japon - Centre (Osaka) (grappe dédiée à l'IA uniquement)
- Arabie saoudite - Centre (Riyad) (grappe dédiée à l'IA uniquement)
- Royaume-Uni - Sud (Londres) (grappe dédiée à l'IA uniquement)
- États-Unis - Est (Ashburn) (grappe dédiée à l'IA uniquement)
- Midwest des États-Unis (Chicago) (grappe dédiée à l'IA uniquement)
Disponible dans cette région souveraine
Ce modèle est disponible dans EU Sovereign Central (Francfort) (grappe dédiée à l'IA uniquement) au moyen des points d'extrémité d'API suivants :
- API d'inférence :
https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu
- API de gestion :
https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu
Dans l'API, pour le nom du modèle et l'OCID du modèle, utilisez cohere.rerank.v3-5
.
En savoir plus sur l'infonuagique souveraine Oracle EU Sovereign Cloud.
Accéder à ce modèle
Principales fonctions
- Mode dédié uniquement.
- Non disponible sur demande ou sur le terrain de jeu.
- Accédez au modèle hébergé sur une grappe au moyen de l'API et de la trousse SDK.
- Pour le mode dédié, créez un point d'extrémité sur une grappe d'IA dédiée d'hébergement, hébergez le modèle sur la grappe, puis exécutez l'API RerankText ou sa trousse SDK pertinente.
Grappe d'IA dédiée pour le modèle
Pour atteindre un modèle au moyen d'une grappe dédiée à l'IA dans n'importe quelle région répertoriée, vous devez créer un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.
Modèle de base | Cluster de réglage fin | Grappe d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de grappe |
---|---|---|---|---|
|
Non disponible pour le réglage fin |
|
|
|
Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger le modèle Cohere Rerank 3.5 sur une grappe dédiée à l'IA, demandez que la limite dedicated-unit-rerank-cohere-count
augmente de 1.
Règles de point d'extrémité pour les grappes
- Une grappe dédiée à l'IA peut contenir jusqu'à 50 points d'extrémité.
- Utilisez ces points d'extrémité pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas vers les deux types.
- Plusieurs points d'extrémité pour le même modèle permettent de les affecter facilement à différents utilisateurs ou objectifs.
Taille d'unité de la grappe d'hébergement | Règles de point d'extrémité |
---|---|
RERANK_COHERE |
|
-
Pour augmenter le volume d'appels pris en charge par une grappe d'hébergement, augmentez le nombre d'instances en modifiant la grappe dédiée à l'IA. Voir Mise à jour d'une grappe d'intelligence artificielle dédiée.
-
Pour plus de 50 points d'extrémité par grappe, demandez une augmentation de la limite,
endpoint-per-dedicated-unit-count
. Voir Demande d'une augmentation de limite de service et Limites de service pour l'IA générative.
Tests de performance des grappes
Consultez les points de référence de performance de grappe Cohere Rerank 3.5 pour différents scénarios.
Dates de lancement et de mise hors service
Modèle | Date de version | Date de mise hors service sur demande | Date de mise hors service en mode dédié |
---|---|---|---|
cohere.rerank.v3-5
|
2,025-5-14 | Le mode sur demande n'est pas disponible pour ce modèle. | Au moins 6 mois après la publication du 1er modèle de remplacement. |
Pour obtenir la liste de toutes les lignes de temps du modèle et les détails de mise hors service, voir Mise hors service des modèles.
Rétablir le paramètre du modèle
Pour connaître les paramètres du modèle Rerank, consultez la documentation sur l'API RerankText.