Cohere Rerank 4

Cohere Rerank 4 est un modèle de reclassement disponible en deux variantes, Pro et Fast.

Le reclassement améliore la pertinence de la recherche en réorganisant un jeu initial de résultats extraits. Après qu'une étape d'extraction retourne des documents de candidature, le modèle de reclassement compare l'interrogation à chaque candidat et classe les résultats de la plus pertinente à la moins pertinente.

Cohere Rerank 4 prend en charge le reclassement multilingue et le contenu semi-structuré, y compris JSON, les tables et le contenu de type code.

Quoi de neuf dans Rerank 4

Par rapport à Cohere Rerank 3.5, Rerank 4 ajoute une fenêtre contextuelle plus large, une qualité de reclassement améliorée, un soutien à l'auto-apprentissage et deux variantes optimisées pour différentes exigences de charge de travail

Fenêtre contextuelle améliorée

Rerank 4 prend en charge une fenêtre contextuelle de 32 000 jetons. La fenêtre contextuelle plus large améliore le traitement des documents longs et des entrées de candidats plus volumineuses, ce qui est utile pour les contenus d'entreprise denses tels que les rapports, les contrats, les manuels et la documentation technique.

Amélioration de la qualité de reclassement

Le reclassement 4 améliore l'ordre des résultats pour les charges de travail d'extraction d'entreprise. Il fournit un classement plus pertinent pour le contenu commercial, financier, technique et autre spécifique au domaine, ce qui peut améliorer les flux de travail de génération augmentés par récupération en aval en surplombant un contexte plus pertinent.

Soutien à l'autoapprentissage

Rerank 4 introduit la prise en charge de l'auto-apprentissage, qui aide à adapter le comportement de reclassement aux données, à la terminologie et aux préférences de pertinence propres au domaine sans nécessiter de données d'entraînement annotées.

Variantes Pro et Fast

Rerank 4 est disponible en deux variantes :

  • Le service Pro est optimisé pour un reclassement plus précis et des tâches d'extraction plus complexes.
  • Rapide est optimisé pour les charges de travail à latence inférieure et à débit supérieur.
Prise en charge des données multilingues et semi-structurées

Rerank 4 prend en charge le reclassement pour le contenu anglais et non anglais dans plus de 100 langues. Il prend également en charge le contenu semi-structuré, notamment JSON, les tables et le contenu de type code.

Variantes de modèle

Cohere Rerank 4 comprend les variantes de modèle suivantes :

Modèle Nom du modèle OCI Description
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Modèle de reclassement multilingue pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail de reclassement complexes et axées sur la qualité.
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Modèle de reclassement multilingue léger pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail à faible latence et à haut débit.

Mode sur demande

Certaines variantes de Cohere Rerank 4 sont disponibles sur demande dans les régions prises en charge. Le mode sur demande ne nécessite pas de grappe dédiée à l'IA.

Voir Modèles par région pour vérifier quelles variantes de modèle sont disponibles sur demande et dans quelles régions.

Nom de modèle Nom du modèle OCI Nom du produit de la page de tarification
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Rerank 4 Pro
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Rerank 4 Fast

Les tarifs sont basés sur 1 000 unités de recherche. Voir la page Tarification.

En savoir plus sur le mode sur demande.

Grappe d'IA dédiée pour le modèle

Certaines variantes de Cohere Rerank 4 sont disponibles au moyen de grappes d'IA dédiées dans des régions prises en charge. Ces modèles ne sont pas disponibles pour le réglage fin.

Pour le mode dédié, créez un point d'extrémité dans une grappe d'IA dédiée à l'hébergement.

Modèle Taille de l'unité matérielle Régions disponibles Demander une augmentation de limite de grappe
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) COHERE_A100_80G_X1
  • États-Unis - Est (Ashburn)
  • États-Unis - Ouest (Phoenix)
  • Nom de la limite : dedicated-unit-a100-80g-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) COHERE_H100_X1
  • Brésil - Est (Sao Paulo)
  • Allemagne - Centre (Francfort)
  • Inde - Sud (Hyderabad)
  • Japon - Centre (Osaka)
  • Royaume-Uni - Sud (Londres)
  • États-Unis - Midwest (Chicago)
  • Nom de la limite : dedicated-unit-h100-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) COHERE_A100_80G_X1
  • États-Unis - Ouest (Phoenix)
  • Nom de la limite : dedicated-unit-a100-80g-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) COHERE_H100_X1
  • Brésil - Est (Sao Paulo)
  • Allemagne - Centre (Francfort)
  • Inde - Sud (Hyderabad)
  • Japon - Centre (Osaka)
  • Royaume-Uni - Sud (Londres)
  • États-Unis - Est (Ashburn)
  • États-Unis - Midwest (Chicago)
  • Nom de la limite : dedicated-unit-h100-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1

Pour les tarifs, consultez l'évaluateur de coût et la page de tarification.

Conseil

Si la location n'a pas suffisamment de limites pour héberger ces modèles dans une grappe dédiée à l'IA, demandez une augmentation de limite pour la forme matérielle utilisée dans la région cible. Par exemple, pour héberger les modèles dans US West (Phoenix), demandez une augmentation de 1 pour dedicated-unit-a100-80g-count.

Accéder à ce modèle

Pour utiliser un modèle Cohere Rerank 4, appelez l'API RerankText à partir d'une région prise en charge.

Point d'extrémité
https://inference.generativeai.{region}.oci.oraclecloud.com
Opération d'API
POST /20231130/actions/rerankText

Dans RerankTextDetails, pour servingMode, définissez l'attribut servingType en fonction de la façon dont vous voulez accéder au modèle :

  • Utilisez ON_DEMAND pour un modèle sur demande dans une région prise en charge.
  • Utilisez DEDICATED pour un modèle hébergé sur un point d'extrémité de grappe dédiée à l'IA.

Pour plus de détails sur la disponibilité et la configuration, voir les sections Mode sur demande et Grappe dédiée à l'IA pour le modèle précédentes.

Modifier le rang des paramètres du modèle

Pour les paramètres du modèle Rerank, consultez la documentation sur l'API RerankText.