Cohere Rerank 3.5

Le modèle cohere.rerank.v3-5 prend une requête et une liste de textes et génère un tableau ordonné avec un score de pertinence affecté à chaque texte. Le score de pertinence est la façon dont le modèle classe les documents, c'est-à-dire la façon dont chaque texte correspond à la requête.

Disponible dans ces régions commerciales

  • Est du Brésil (São Paulo) (cluster d'IA dédié uniquement)
  • Allemagne centrale (Francfort) (cluster d'IA dédié uniquement)
  • Japan Central (Osaka) (cluster d'IA dédié uniquement)
  • Centre de l'Arabie saoudite (Riyad) (cluster d'IA dédié uniquement)
  • Sud du Royaume-Uni (Londres) (cluster d'IA dédié uniquement)
  • Est des Etats-Unis (Ashburn) (cluster d'IA dédié uniquement)
  • Midwest des Etats-Unis (Chicago) (cluster d'IA dédié uniquement)

Disponible dans cette région souveraine

Ce modèle est disponible dans EU Sovereign Central (Francfort) (cluster d'IA dédié uniquement) via les adresses d'API suivantes :

  • API d'inférence :

    https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu

  • API de gestion :

    https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu

Dans l'API, pour le nom de modèle et l'OCID de modèle, utilisez cohere.rerank.v3-5.

En savoir plus sur Oracle EU Sovereign Cloud.

Principales fonctionnalités

  • Mode dédié uniquement.
  • Non disponible à la demande ou dans l'aire de jeux.
  • Accéder au modèle hébergé sur un cluster via l'API et le SDK.
  • Pour le mode dédié, créez une adresse sur un cluster d'IA dédié d'hébergement, hébergez le modèle sur le cluster, puis exécutez l'API RerankText ou son kit SDK approprié.

Cluster d'IA dédié pour le modèle

Pour atteindre un modèle via un cluster d'IA dédié dans une région répertoriée, vous devez créer une adresse pour ce modèle sur un cluster d'IA dédié. Pour connaître la taille d'unité de cluster correspondant à ce modèle, reportez-vous au tableau suivant.

Modèle de base Cluster de réglage fin Cluster d'hébergement Informations sur la page de tarification Demander une augmentation de limite de cluster
  • Nom du modèle : Cohere Rerank 3.5
  • Nom du modèle OCI : cohere.rerank.v3-5
Non disponible pour le réglage fin
  • Taille d'unité : RERANK_COHERE
  • Unités obligatoires : 1
  • Nom du produit de la page de tarification : Cohere Rerank - Dedicated
  • Nom de la limite : dedicated-unit-rerank-cohere-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Conseil

Si votre location ne dispose pas de suffisamment de limites de cluster pour héberger le modèle Cohere Rerank 3.5 sur un cluster d'IA dédié, demandez une augmentation de 1 de la limite dedicated-unit-rerank-cohere-count.

Règles d'adresse pour les clusters

  • Un cluster d'IA dédié peut contenir jusqu'à 50 adresses.
  • Utilisez ces adresses pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas les deux types.
  • Plusieurs points d'extrémité pour le même modèle facilitent leur affectation à différents utilisateurs ou objectifs.
Taille de l'unité de cluster d'hébergement Règles d'adresse
RERANK_COHERE
  • Modèle de base : pour exécuter le modèle ⁇ cohere.rerank.v3-5 ⁇ sur plusieurs adresses, créez autant d'adresses que nécessaire sur un cluster RERANK_COHERE (taille d'unité).
  • Modèle personnalisé : vous ne pouvez pas affiner ⁇ cohere.rerank.v3-5, de sorte que vous ne pouvez pas créer et héberger des modèles personnalisés créés à partir de cette base.
Conseil

Tests de performances du cluster

Consultez les tests d'évaluation des performances du cluster Cohere Rerank 3.5 pour différents scénarios.

Dates de déblocage et de sortie

Modèle Date de lancement Date de sortie à la demande Date de retrait du mode dédié
cohere.rerank.v3-5 2 025-5-14 Le mode à la demande n'est pas disponible pour ce modèle. Au moins 6 mois après la publication du 1er modèle de remplacement.
Important

Pour obtenir la liste de toutes les lignes de temps du modèle et des détails de sortie, voir Mettre hors service les modèles.

Paramètre de modèle de reclassement

Pour les paramètres de modèle Rerank, reportez-vous à la documentation de l'API RerankText.