Cohere Rerank 4

Cohere Rerank 4 est un modèle de rerank disponible en deux variantes, Pro et Fast.

Le reclassement améliore la pertinence de la recherche en réorganisant un premier ensemble de résultats extraits. Une fois qu'une étape d'extraction a renvoyé des documents de candidat, le modèle de classement compare la requête à chaque candidat et classe les résultats du plus pertinent au moins pertinent.

Cohere Rerank 4 prend en charge le reclassement multilingue et le contenu semi-structuré, y compris le JSON, les tables et le contenu de type code.

Nouveautés de Rerank 4

Comparé à Cohere Rerank 3.5, Rerank 4 ajoute une fenêtre contextuelle plus large, une meilleure qualité de reclassement, une prise en charge de l'auto-apprentissage et deux variantes optimisées pour différentes exigences de charge de travail

Fenêtre contextuelle augmentée

Le Rerank 4 prend en charge une fenêtre de contexte de 32 000 jetons. La fenêtre de contexte plus large améliore la gestion des documents longs et des entrées de candidats plus importantes, ce qui est utile pour les contenus d'entreprise denses tels que les rapports, les contrats, les manuels et la documentation technique.

Amélioration de la qualité de reclassement

Rerank 4 améliore le classement des résultats pour les charges de travail d'extraction d'entreprise. Il fournit un classement plus pertinent pour les contenus commerciaux, financiers, techniques et autres contenus propres à un domaine, ce qui peut améliorer les workflows de génération augmentée par extraction en aval en surfant sur un contexte plus pertinent.

Prise en charge de l'autoapprentissage

Rerank 4 introduit la prise en charge de l'auto-apprentissage, qui aide à adapter le comportement de reclassement aux données, à la terminologie et aux préférences de pertinence propres au domaine sans nécessiter de données d'entraînement annotées.

Variantes Pro et Fast

Rerank 4 est disponible en deux variantes :

  • Pro est optimisé pour des tâches de reclassement plus précises et d'extraction plus complexes.
  • Fast est optimisé pour les charges de travail à faible latence et à haut débit.
Prise en charge des données multilingues et semi-structurées

Rerank 4 prend en charge le reclassement du contenu en anglais et non en anglais dans plus de 100 langues. Il prend également en charge le contenu semi-structuré, notamment JSON, les tables et le contenu de type code.

Régions pour ce modèle

Important

Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.

Variantes de modèle

Cohere Rerank 4 comprend les variantes de modèle suivantes :

Modèle Nom du modèle OCI Description
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Modèle de reclassement multilingue pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail complexes et axées sur la qualité.
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Modèle de reclassement multilingue léger pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail à faible latence et à haut débit.

Mode à la demande

Certaines variantes de Cohere Rerank 4 sont disponibles à la demande dans les régions prises en charge. Le mode à la demande ne nécessite pas de cluster d'IA dédié.

Reportez-vous à Modèles par région pour vérifier quelles variantes de modèle sont disponibles à la demande et dans quelles régions.

Nom du modèle Nom du modèle OCI Nom du produit de la page de tarification
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Rerank 4 Pro
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Rerank 4 Fast

La tarification est basée sur 1 000 unités de recherche. Reportez-vous à la page Tarifs.

Découvrez le mode à la demande.

Cluster d'IA dédié pour le modèle

Certaines variantes de Cohere Rerank 4 sont disponibles via des clusters d'IA dédiés dans les régions prises en charge. Ces modèles ne sont pas disponibles pour le réglage fin.

Pour le mode dédié, créez une adresse sur un cluster d'IA dédié d'hébergement.

Modèle Taille de l'unité matérielle Régions disponibles Demander une augmentation de limite de cluster
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) COHERE_A100_80G_X1
  • Est des Etats-Unis (Ashburn)
  • Ouest des Etats-Unis (Phoenix)
  • Nom de la limite : dedicated-unit-a100-80g-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) COHERE_H100_X1
  • Est du Brésil (São Paulo)
  • Allemagne centrale (Francfort)
  • Sud de l'Inde (Hyderabad)
  • Centre du Japon (Osaka)
  • Sud du Royaume-Uni (Londres)
  • Midwest des Etats-Unis (Chicago)
  • Nom de la limite : dedicated-unit-h100-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) COHERE_A100_80G_X1
  • Ouest des Etats-Unis (Phoenix)
  • Nom de la limite : dedicated-unit-a100-80g-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) COHERE_H100_X1
  • Est du Brésil (São Paulo)
  • Allemagne centrale (Francfort)
  • Sud de l'Inde (Hyderabad)
  • Centre du Japon (Osaka)
  • Sud du Royaume-Uni (Londres)
  • Est des Etats-Unis (Ashburn)
  • Midwest des Etats-Unis (Chicago)
  • Nom de la limite : dedicated-unit-h100-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1

Pour connaître la tarification, reportez-vous à Outil d'estimation des coûts et à la page Tarification.

Conseil

Si la location n'a pas suffisamment de limites pour héberger ces modèles sur un cluster d'IA dédié, demandez une augmentation de limite pour la forme matérielle utilisée dans la région cible. Par exemple, pour héberger les modèles dans l'ouest des Etats-Unis (Phoenix), demandez une augmentation de 1 pour dedicated-unit-a100-80g-count.

Accéder à ce modèle

Pour utiliser un modèle Cohere Rerank 4, appelez l'API RerankText à partir d'une région prise en charge.

Adresse
https://inference.generativeai.{region}.oci.oraclecloud.com
Opération d'API
POST /20231130/actions/rerankText

Dans RerankTextDetails, pour servingMode, définissez l'attribut servingType en fonction de la façon dont vous voulez accéder au modèle :

  • Utilisez ON_DEMAND pour un modèle à la demande dans une région prise en charge.
  • Utilisez DEDICATED pour un modèle hébergé sur une adresse de cluster d'IA dédiée.

Pour plus d'informations sur la disponibilité et la configuration, reportez-vous aux sections Mode à la demande et Cluster d'IA dédié pour le modèle précédentes.

Paramètres du modèle de reclassement

Pour les paramètres de modèle Rerank, reportez-vous à la documentation de l'API RerankText.