Cohere Rerank 4
Cohere Rerank 4 est un modèle de reclassement disponible en deux variantes, Pro et Fast.
Le reclassement améliore la pertinence de la recherche en réorganisant un jeu initial de résultats extraits. Après qu'une étape d'extraction retourne des documents de candidature, le modèle de reclassement compare l'interrogation à chaque candidat et classe les résultats de la plus pertinente à la moins pertinente.
Cohere Rerank 4 prend en charge le reclassement multilingue et le contenu semi-structuré, y compris JSON, les tables et le contenu de type code.
Quoi de neuf dans Rerank 4
Par rapport à Cohere Rerank 3.5, Rerank 4 ajoute une fenêtre contextuelle plus large, une qualité de reclassement améliorée, un soutien à l'auto-apprentissage et deux variantes optimisées pour différentes exigences de charge de travail
- Fenêtre contextuelle améliorée
-
Rerank 4 prend en charge une fenêtre contextuelle de 32 000 jetons. La fenêtre contextuelle plus large améliore le traitement des documents longs et des entrées de candidats plus volumineuses, ce qui est utile pour les contenus d'entreprise denses tels que les rapports, les contrats, les manuels et la documentation technique.
- Amélioration de la qualité de reclassement
-
Le reclassement 4 améliore l'ordre des résultats pour les charges de travail d'extraction d'entreprise. Il fournit un classement plus pertinent pour le contenu commercial, financier, technique et autre spécifique au domaine, ce qui peut améliorer les flux de travail de génération augmentés par récupération en aval en surplombant un contexte plus pertinent.
- Soutien à l'autoapprentissage
-
Rerank 4 introduit la prise en charge de l'auto-apprentissage, qui aide à adapter le comportement de reclassement aux données, à la terminologie et aux préférences de pertinence propres au domaine sans nécessiter de données d'entraînement annotées.
- Variantes Pro et Fast
-
Rerank 4 est disponible en deux variantes :
- Le service Pro est optimisé pour un reclassement plus précis et des tâches d'extraction plus complexes.
- Rapide est optimisé pour les charges de travail à latence inférieure et à débit supérieur.
- Prise en charge des données multilingues et semi-structurées
-
Rerank 4 prend en charge le reclassement pour le contenu anglais et non anglais dans plus de 100 langues. Il prend également en charge le contenu semi-structuré, notamment JSON, les tables et le contenu de type code.
Régions pour ce modèle
Pour les régions prises en charge, les types de point d'extrémité (grappes d'IA sur demande ou dédiées) et l'hébergement (IA générative pour OCI ou appels externes) pour ce modèle, voir la page Modèles par région. Pour plus de détails sur les régions, consultez la page Régions du service d'intelligence artificielle générative.
Variantes de modèle
Cohere Rerank 4 comprend les variantes de modèle suivantes :
| Modèle | Nom du modèle OCI | Description |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Modèle de reclassement multilingue pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail de reclassement complexes et axées sur la qualité. |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Modèle de reclassement multilingue léger pour le texte anglais et non anglais et les données JSON semi-structurées. Idéal pour les charges de travail à faible latence et à haut débit. |
Mode sur demande
Certaines variantes de Cohere Rerank 4 sont disponibles sur demande dans les régions prises en charge. Le mode sur demande ne nécessite pas de grappe dédiée à l'IA.
Voir Modèles par région pour vérifier quelles variantes de modèle sont disponibles sur demande et dans quelles régions.
| Nom de modèle | Nom du modèle OCI | Nom du produit de la page de tarification |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Rerank 4 Pro |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Rerank 4 Fast |
Les tarifs sont basés sur 1 000 unités de recherche. Voir la page Tarification.
En savoir plus sur le mode sur demande.
Grappe d'IA dédiée pour le modèle
Certaines variantes de Cohere Rerank 4 sont disponibles au moyen de grappes d'IA dédiées dans des régions prises en charge. Ces modèles ne sont pas disponibles pour le réglage fin.
Pour le mode dédié, créez un point d'extrémité dans une grappe d'IA dédiée à l'hébergement.
| Modèle | Taille de l'unité matérielle | Régions disponibles | Demander une augmentation de limite de grappe |
|---|---|---|---|
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Pro (cohere.rerank-v4.0-pro) |
COHERE_H100_X1 |
|
|
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) |
COHERE_A100_80G_X1 |
|
|
Cohere Rerank 4 Fast (cohere.rerank-v4.0-fast) |
COHERE_H100_X1 |
|
|
Pour les tarifs, consultez l'évaluateur de coût et la page de tarification.
Si la location n'a pas suffisamment de limites pour héberger ces modèles dans une grappe dédiée à l'IA, demandez une augmentation de limite pour la forme matérielle utilisée dans la région cible. Par exemple, pour héberger les modèles dans US West (Phoenix), demandez une augmentation de 1 pour dedicated-unit-a100-80g-count.
Accéder à ce modèle
Pour utiliser un modèle Cohere Rerank 4, appelez l'API RerankText à partir d'une région prise en charge.
- Point d'extrémité
https://inference.generativeai.{region}.oci.oraclecloud.com- Opération d'API
POST /20231130/actions/rerankText
Dans RerankTextDetails, pour servingMode, définissez l'attribut servingType en fonction de la façon dont vous voulez accéder au modèle :
- Utilisez
ON_DEMANDpour un modèle sur demande dans une région prise en charge. - Utilisez
DEDICATEDpour un modèle hébergé sur un point d'extrémité de grappe dédiée à l'IA.
Pour plus de détails sur la disponibilité et la configuration, voir les sections Mode sur demande et Grappe dédiée à l'IA pour le modèle précédentes.
Dates de version et de mise hors service OCI
Pour connaître les dates de sortie et de mise hors service et les options de modèle de remplacement, consultez les pages suivantes en fonction du mode (sur demande ou dédié) :
Modifier le rang des paramètres du modèle
Pour les paramètres du modèle Rerank, consultez la documentation sur l'API RerankText.