Cohere Embed English 3
Le modèle cohere.embed-english-v3.0
transforme chaque phrase, phrase ou paragraphe que vous entrez en tableau.
Vous pouvez utiliser les modèles d'intégration pour rechercher des similarités dans des expressions similaires dans un contexte ou une catégorie. Les intégrations sont généralement stockées dans une base de données vectorielle. Les plongements sont principalement utilisés pour les recherches sémantiques, dans lesquelles la fonction de recherche se concentre sur la signification du texte recherché, plutôt que sur l'obtention de résultats basés sur des mots clés.
Disponible dans ces régions
- Brésil - Est (Sao Paulo)
- Allemagne - Centre (Francfort)
- Japon - Centre (Osaka)
- Émirats arabes unis - Est (Dubaï) (grappe dédiée à l'IA uniquement)
- Royaume-Uni - Sud (Londres)
- États-Unis - Midwest (Chicago)
Principales fonctions
- Utilisez les modèles Cohere Embed English pour générer des plongements de texte à partir de documents anglais.
- Anglais ou multilingue.
- Le modèle crée un vecteur à 1 024 dimensions pour chaque plongement.
- 96 phrases par exécution au maximum.
- Maximum de 512 jetons pour chaque entrée.
Grappe d'IA dédiée pour le modèle
Pour atteindre un modèle au moyen d'une grappe dédiée à l'IA dans n'importe quelle région répertoriée, vous devez créer un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.
Modèle de base | Cluster de réglage fin | Grappe d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de grappe |
---|---|---|---|---|
|
Non disponible pour le réglage fin |
|
|
|
-
Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger un modèle intégré dans une grappe dédiée à l'IA, demandez que la limite
dedicated-unit-embed-cohere-count
augmente de 1. - Consultez les points de référence de performance de grappe Cohere Embed English 3 pour différents cas d'utilisation.
Dates de lancement et de mise hors service
Modèle | Date de version | Date de mise hors service sur demande | Date de mise hors service en mode dédié |
---|---|---|---|
cohere.embed-english-v3.0
|
2,024-2-7 | 2,026-1-22 | cohere.embed-v4.0
|
Pour obtenir la liste de toutes les lignes de temps du modèle et les détails de mise hors service, voir Mise hors service des modèles.
Paramètre de modèle de plongement
Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.
- Truncate
-
Indique s'il faut tronquer les jetons de début ou de fin d'une phrase, lorsque celle-ci dépasse le nombre maximal de jetons autorisés. Par exemple, une phrase comporte 516 jetons, mais la taille maximale du jeton est 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.