Cohere Rerank 4
Cohere Rerank 4 est un modèle de rerank disponible en deux variantes, Pro et Fast.
Le reclassement améliore la pertinence de la recherche en réorganisant un premier ensemble de résultats extraits. Une fois qu'une étape d'extraction a renvoyé des documents de candidat, le modèle de classement compare la requête à chaque candidat et classe les résultats du plus pertinent au moins pertinent.
Cohere Rerank 4 prend en charge le reclassement multilingue et le contenu semi-structuré, y compris le JSON, les tables et le contenu de type code.
Nouveautés de Rerank 4
Comparé à Cohere Rerank 3.5, Rerank 4 ajoute une fenêtre contextuelle plus large, une meilleure qualité de reclassement, une prise en charge de l'auto-apprentissage et deux variantes optimisées pour différentes exigences de charge de travail
- Fenêtre contextuelle augmentée
-
Le Rerank 4 prend en charge une fenêtre de contexte de 32 000 jetons. La fenêtre de contexte plus large améliore la gestion des documents longs et des entrées de candidats plus importantes, ce qui est utile pour les contenus d'entreprise denses tels que les rapports, les contrats, les manuels et la documentation technique.
- Amélioration de la qualité de reclassement
-
Rerank 4 améliore le classement des résultats pour les charges de travail d'extraction d'entreprise. Il fournit un classement plus pertinent pour les contenus commerciaux, financiers, techniques et autres contenus propres à un domaine, ce qui peut améliorer les workflows de génération augmentée par extraction en aval en surfant sur un contexte plus pertinent.
- Prise en charge de l'autoapprentissage
-
Rerank 4 introduit la prise en charge de l'auto-apprentissage, qui aide à adapter le comportement de reclassement aux données, à la terminologie et aux préférences de pertinence propres au domaine sans nécessiter de données d'entraînement annotées.
- Variantes Pro et Fast
-
Rerank 4 est disponible en deux variantes :
- Pro est optimisé pour des tâches de reclassement plus précises et d'extraction plus complexes.
- Fast est optimisé pour les charges de travail à faible latence et à haut débit.
- Prise en charge des données multilingues et semi-structurées
-
Rerank 4 prend en charge le reclassement du contenu en anglais et non en anglais dans plus de 100 langues. Il prend également en charge le contenu semi-structuré, notamment JSON, les tables et le contenu de type code.
Régions pour ce modèle
Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.
Variantes de modèle
Cohere Rerank 4 comprend les variantes de modèle suivantes :
| Modèle | Nom du modèle OCI | Description |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Modèle de reclassement multilingue pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail complexes et axées sur la qualité. |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Modèle de reclassement multilingue léger pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail à faible latence et à haut débit. |
Mode à la demande
Certaines variantes de Cohere Rerank 4 sont disponibles à la demande dans les régions prises en charge. Le mode à la demande ne nécessite pas de cluster d'IA dédié.
Reportez-vous à Modèles par région pour vérifier quelles variantes de modèle sont disponibles à la demande et dans quelles régions.
| Nom du modèle | Nom du modèle OCI | Nom du produit de la page de tarification |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Rerank 4 Pro |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Rerank 4 Fast |
La tarification est basée sur 1 000 unités de recherche. Reportez-vous à la page Tarifs.
Découvrez le mode à la demande.
Cluster d'IA dédié pour le modèle
Certaines variantes de Cohere Rerank 4 sont disponibles via des clusters d'IA dédiés dans les régions prises en charge. Ces modèles ne sont pas disponibles pour le réglage fin.
Pour le mode dédié, créez une adresse sur un cluster d'IA dédié d'hébergement.
| Modèle | Taille de l'unité matérielle | Régions disponibles | Demander une augmentation de limite de cluster |
|---|---|---|---|
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) |
COHERE_H100_X1 |
|
|
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) |
COHERE_H100_X1 |
|
|
Pour connaître la tarification, reportez-vous à Outil d'estimation des coûts et à la page Tarification.
Si la location n'a pas suffisamment de limites pour héberger ces modèles sur un cluster d'IA dédié, demandez une augmentation de limite pour la forme matérielle utilisée dans la région cible. Par exemple, pour héberger les modèles dans l'ouest des Etats-Unis (Phoenix), demandez une augmentation de 1 pour dedicated-unit-a100-80g-count.
Accéder à ce modèle
Pour utiliser un modèle Cohere Rerank 4, appelez l'API RerankText à partir d'une région prise en charge.
- Adresse
https://inference.generativeai.{region}.oci.oraclecloud.com- Opération d'API
POST /20231130/actions/rerankText
Dans RerankTextDetails, pour servingMode, définissez l'attribut servingType en fonction de la façon dont vous voulez accéder au modèle :
- Utilisez
ON_DEMANDpour un modèle à la demande dans une région prise en charge. - Utilisez
DEDICATEDpour un modèle hébergé sur une adresse de cluster d'IA dédiée.
Pour plus d'informations sur la disponibilité et la configuration, reportez-vous aux sections Mode à la demande et Cluster d'IA dédié pour le modèle précédentes.
Dates de publication et de retrait OCI
Pour les dates de sortie et de sortie et les options de modèle de remplacement, reportez-vous aux pages suivantes en fonction du mode (à la demande ou dédié) :
Paramètres du modèle de reclassement
Pour les paramètres de modèle Rerank, reportez-vous à la documentation de l'API RerankText.