Cohere Embed Multilingual Light Image 3
cohere.embed-multilingual-light-image-v3.0
est un modèle multimodal qui peut créer des incorporations de texte à partir d'entrées de texte ou d'une image. L'entrée d'image n'est pas disponible dans la console et vous devez utiliser l'API. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.
Disponible dans ces régions
- Est du Brésil (São Paulo) (cluster d'IA dédié uniquement)
- Allemagne centrale (Francfort) (cluster d'IA dédié uniquement)
- Japan Central (Osaka) (cluster d'IA dédié uniquement)
- Est des Émirats arabes unis (Dubaï) (cluster d'IA dédié uniquement)
- Sud du Royaume-Uni (Londres) (cluster d'IA dédié uniquement)
- Est des Etats-Unis (Ashburn) (cluster d'IA dédié uniquement)
- Midwest des Etats-Unis (Chicago) (cluster d'IA dédié uniquement)
Accéder à ce modèle
Principales fonctionnalités
- Entrez du texte ou une image, mais pas les deux.
- Pour obtenir des incorporations pour une image, une seule image est autorisée. Vous ne pouvez pas combiner texte et image pour la même intégration. Saisie d'image via l'API uniquement.
- Les modèles légers sont plus petits et plus rapides que les modèles originaux.
- Anglais ou multilingue.
- Le modèle crée un vecteur à 384 dimensions pour chaque plongement.
- 128 000 jetons maximum par intégration.
- Dans la console, entrez une image
.png
ou.jpg
de 5 Mo ou moins. - Pour l'API, entrez une image encodée
base64
à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons. - Utilisez les modèles multilingues Cohere Embed lorsque :
- Au lieu de l'anglais, les documents sont écrits dans l'une des langues prises en charge.
- Les documents sont écrits dans plusieurs langues et ces langues sont l'une des langues prises en charge.
Mode à la demande
Le modèle cohere.embed-multilingual-light-image-v3.0
n'est pas disponible en mode à la demande.
Cluster d'IA dédié pour le modèle
Pour atteindre un modèle via un cluster d'IA dédié dans une région répertoriée, vous devez créer une adresse pour ce modèle sur un cluster d'IA dédié. Pour connaître la taille d'unité de cluster correspondant à ce modèle, reportez-vous au tableau suivant.
Modèle de base | Cluster de réglage fin | Cluster d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de cluster |
---|---|---|---|---|
|
Non disponible pour le réglage fin |
|
|
|
Si votre location ne dispose pas de suffisamment de limites de cluster pour héberger un modèle Embed sur un cluster d'IA dédié, demandez une augmentation de 1 de la limite dedicated-unit-embed-cohere-count
.
Règles d'adresse pour les clusters
- Un cluster d'IA dédié peut contenir jusqu'à 50 adresses.
- Utilisez ces adresses pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas les deux types.
- Plusieurs points d'extrémité pour le même modèle facilitent leur affectation à différents utilisateurs ou objectifs.
Taille de l'unité de cluster d'hébergement | Règles d'adresse |
---|---|
Embed Cohere |
|
-
Pour augmenter le volume d'appels pris en charge par un cluster d'hébergement, augmentez le nombre d'instances en modifiant le cluster d'IA dédié. Reportez-vous à Mise à jour d'un cluster d'IA dédié.
-
Pour plus de 50 adresses par cluster, demandez une augmentation de la limite,
endpoint-per-dedicated-unit-count
. Reportez-vous à Demande d'augmentation de limite de service et à Limites de service pour l'IA générative.
Tests de performances du cluster
Consultez les tests d'évaluation des performances du cluster Cohere Embed Multilingual Light Image 3 pour différents cas d'utilisation.
Dates de déblocage et de sortie
Modèle | Date de lancement | Date de sortie à la demande | Date de retrait du mode dédié |
---|---|---|---|
cohere.embed-multilingual-light-image-v3.0
|
2 025-5-14 | Le mode à la demande n'est pas disponible pour ce modèle. | 2 026-1-22 |
Pour obtenir la liste de toutes les lignes de temps du modèle et des détails de sortie, voir Mettre hors service les modèles.
Données d'entrée pour les incorporations de texte
Les données d'entrée nécessaires à la création d'intégrations de texte sont les suivantes :
- Vous pouvez ajouter des phrases, des expressions ou des paragraphes pour les incorporations, soit une phrase à la fois, soit en chargeant un fichier.
- Seuls les fichiers avec l'extension
.txt
sont autorisés. - Si vous utilisez un fichier d'entrée, chaque phrase, expression ou paragraphe d'entrée dans le fichier doit être séparé par un caractère d'entrée à une nouvelle ligne.
- Un maximum de 96 entrées est autorisé pour chaque exécution.
- Dans la console, chaque entrée doit être inférieure à 512 jetons pour les modèles de texte uniquement.
- Si une entrée est trop longue, indiquez si le début ou la fin du texte doit être coupé dans la limite du jeton en définissant le paramètre Truncate sur Start ou End. Si une entrée dépasse la limite de jeton 512 et que le paramètre Truncate est défini sur None, un message d'erreur s'affiche.
- Pour les modèles de texte et d'image, vous pouvez avoir des fichiers et des entrées qui totalisent tous jusqu'à 128 000 jetons.
- Pour les modèles d'intégration de texte et d'image, tels que Cohere Embed English Image V3, vous pouvez soit ajouter du texte, soit ajouter une seule image. Pour l'image, vous pouvez utiliser une API. L'entrée d'image n'est pas disponible dans la console. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.
En savoir plus sur la création d'intégrations de texte dans OCI Generative AI.
Paramètre du modèle de plongement
Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.
- Tronquer
-
Permet d'indiquer si les sèmes de début ou de fin doivent être tronqués dans une phrase lorsque celle-ci dépasse le nombre maximal de sèmes autorisés. Par exemple, une phrase a 516 jetons, mais la taille maximale du jeton est de 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.