Cohere Embed Multilingual 3
Le modèle cohere.embed-multilingual-v3.0
transforme chaque phrase, phrase ou paragraphe que vous entrez en tableau.
Vous pouvez utiliser les modèles d'intégration pour rechercher des similarités dans des expressions similaires dans un contexte ou une catégorie. Les intégrations sont généralement stockées dans une base de données vectorielle. Les plongements sont principalement utilisés pour les recherches sémantiques, dans lesquelles la fonction de recherche se concentre sur la signification du texte recherché, plutôt que sur l'obtention de résultats basés sur des mots clés.
Disponible dans ces régions
- Brésil - Est (Sao Paulo)
- Allemagne - Centre (Francfort)
- Japon - Centre (Osaka)
- Arabie saoudite - Centre (Riyad) (grappe dédiée à l'IA uniquement)
- Émirats arabes unis - Est (Dubaï)
- Royaume-Uni - Sud (Londres)
- États-Unis - Midwest (Chicago)
Principales fonctions
- Fonctionne pour l'anglais et le multilingue.
- Le modèle crée un vecteur à 1 024 dimensions pour chaque plongement.
- 96 phrases par exécution au maximum.
- Maximum de 512 jetons pour chaque entrée.
- Idéal pour les cas d'utilisation lorsque :
- Au lieu de l'anglais, les documents sont écrits dans l'une des langues prises en charge.
- Les documents sont écrits dans plusieurs langues et celles-ci sont l'une des langues prises en charge.
Grappe d'IA dédiée pour le modèle
Pour atteindre un modèle au moyen d'une grappe dédiée à l'IA dans n'importe quelle région répertoriée, vous devez créer un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.
Modèle de base | Cluster de réglage fin | Grappe d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de grappe |
---|---|---|---|---|
|
Non disponible pour le réglage fin |
|
|
|
-
Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger un modèle intégré dans une grappe dédiée à l'IA, demandez que la limite
dedicated-unit-embed-cohere-count
augmente de 1.
Dates de lancement et de mise hors service
Modèle | Date de version | Date de mise hors service sur demande | Date de mise hors service en mode dédié |
---|---|---|---|
cohere.embed-multilingual-v3.0
|
2,024-2-7 | 2,026-1-22 | cohere.embed-v4.0
|
Pour obtenir la liste de toutes les lignes de temps du modèle et les détails de mise hors service, voir Mise hors service des modèles.
Paramètre de modèle de plongement
Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.
- Truncate
-
Indique s'il faut tronquer les jetons de début ou de fin d'une phrase, lorsque celle-ci dépasse le nombre maximal de jetons autorisés. Par exemple, une phrase comporte 516 jetons, mais la taille maximale du jeton est 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.