Cohere Rerank 3.5

Le modèle cohere.rerank.v3-5 prend une interrogation et une liste de textes et produit un tableau ordonné avec chaque texte affecté une note de pertinence. La note de pertinence est la façon dont le modèle classe les documents, c'est-à-dire la façon dont chaque texte correspond à la requête.

Disponible dans ces régions commerciales

  • Brésil - Est (Sao Paulo) (grappe dédiée à l'IA uniquement)
  • Allemagne - Centre (Francfort) (grappe dédiée à l'IA uniquement)
  • Japon - Centre (Osaka) (grappe dédiée à l'IA uniquement)
  • Arabie saoudite - Centre (Riyad) (grappe dédiée à l'IA uniquement)
  • Royaume-Uni - Sud (Londres) (grappe dédiée à l'IA uniquement)
  • États-Unis - Est (Ashburn) (grappe dédiée à l'IA uniquement)
  • Midwest des États-Unis (Chicago) (grappe dédiée à l'IA uniquement)

Disponible dans cette région souveraine

Ce modèle est disponible dans EU Sovereign Central (Francfort) (grappe dédiée à l'IA uniquement) au moyen des points d'extrémité d'API suivants :

  • API d'inférence :

    https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu

  • API de gestion :

    https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu

Dans l'API, pour le nom du modèle et l'OCID du modèle, utilisez cohere.rerank.v3-5.

En savoir plus sur l'infonuagique souveraine Oracle EU Sovereign Cloud.

Principales fonctions

  • Mode dédié uniquement.
  • Non disponible sur demande ou sur le terrain de jeu.
  • Accédez au modèle hébergé sur une grappe au moyen de l'API et de la trousse SDK.
  • Pour le mode dédié, créez un point d'extrémité sur une grappe d'IA dédiée d'hébergement, hébergez le modèle sur la grappe, puis exécutez l'API RerankText ou sa trousse SDK pertinente.

Grappe d'IA dédiée pour le modèle

Pour atteindre un modèle au moyen d'une grappe dédiée à l'IA dans n'importe quelle région répertoriée, vous devez créer un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.

Modèle de base Cluster de réglage fin Grappe d'hébergement Informations sur la page de tarification Demander une augmentation de limite de grappe
  • Nom du modèle : Cohere Rerank 3.5
  • Nom du modèle OCI : cohere.rerank.v3-5
Non disponible pour le réglage fin
  • Taille de l'unité : RERANK_COHERE
  • Unités requises : 1
  • Nom du produit de la page Tarification : Cohere Rerank - Dedicated
  • Nom de la limite : dedicated-unit-rerank-cohere-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Conseil

Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger le modèle Cohere Rerank 3.5 sur une grappe dédiée à l'IA, demandez que la limite dedicated-unit-rerank-cohere-count augmente de 1.

Règles de point d'extrémité pour les grappes

  • Une grappe dédiée à l'IA peut contenir jusqu'à 50 points d'extrémité.
  • Utilisez ces points d'extrémité pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas vers les deux types.
  • Plusieurs points d'extrémité pour le même modèle permettent de les affecter facilement à différents utilisateurs ou objectifs.
Taille d'unité de la grappe d'hébergement Règles de point d'extrémité
RERANK_COHERE
  • Modèle de base : Pour exécuter le modèle cohere.rerank.v3-5  sur plusieurs points d'extrémité, créez autant de points d'extrémité que nécessaire sur une grappe RERANK_COHERE (taille de l'unité).
  • Modèle personnalisé : Vous ne pouvez pas affiner le réglage cohere.rerank.v3-5, vous ne pouvez donc pas créer et héberger des modèles personnalisés créés à partir de cette base.
Conseil

Tests de performance des grappes

Consultez les points de référence de performance de grappe Cohere Rerank 3.5 pour différents scénarios.

Dates de lancement et de mise hors service

Modèle Date de version Date de mise hors service sur demande Date de mise hors service en mode dédié
cohere.rerank.v3-5 2,025-5-14 Le mode sur demande n'est pas disponible pour ce modèle. Au moins 6 mois après la publication du 1er modèle de remplacement.
Important

Pour obtenir la liste de toutes les lignes de temps du modèle et les détails de mise hors service, voir Mise hors service des modèles.

Rétablir le paramètre du modèle

Pour connaître les paramètres du modèle Rerank, consultez la documentation sur l'API RerankText.