Cohere Embed Multilingual Light Image 3
cohere.embed-multilingual-light-image-v3.0 est un modèle multimodal qui peut créer des incorporations de texte à partir d'entrées de texte ou d'une image. L'entrée d'image n'est pas disponible dans la console et vous devez utiliser l'API. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.
Régions pour ce modèle
Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.
Accéder à ce modèle
Les adresses d'API pour toutes les régions commerciales, souveraines et gouvernementales prises en charge sont répertoriées dans les liens API de gestion et d'inférence. Vous pouvez accéder à chaque modèle uniquement via ses régions prises en charge.
Principales fonctionnalités
- Entrez du texte ou une image, mais pas les deux.
- Pour obtenir des incorporations pour une image, une seule image est autorisée. Vous ne pouvez pas combiner texte et image pour la même intégration. Saisie d'image via l'API uniquement.
- Les modèles légers sont plus petits et plus rapides que les modèles originaux.
- Anglais ou multilingue.
- Le modèle crée un vecteur à 384 dimensions pour chaque plongement.
- 128 000 jetons maximum par intégration.
- Dans la console, entrez une image
.pngou.jpgde 5 Mo ou moins. - Pour l'API, entrez une image encodée
base64à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons. - Utilisez les modèles multilingues Cohere Embed dans les cas suivants :
- Au lieu de l'anglais, les documents sont écrits dans l'une des langues prises en charge.
- Les documents sont écrits dans plusieurs langues et ces langues sont l'une des langues prises en charge.
Mode à la demande
Le modèle cohere.embed-multilingual-light-image-v3.0 n'est pas disponible en mode à la demande.
Dates de publication et de retrait OCI
Pour les dates de déblocage et de sortie et les options de modèle de remplacement, reportez-vous aux pages suivantes en fonction du mode (à la demande ou dédié) :
Règles d'adresse pour les clusters
- Un cluster d'IA dédié peut contenir jusqu'à 50 adresses.
- Utilisez ces adresses pour créer des alias qui pointent tous vers le même modèle de base ou vers la même version d'un modèle personnalisé, mais pas les deux types.
- Plusieurs points d'extrémité pour le même modèle facilitent leur affectation à différents utilisateurs ou objectifs.
| Taille de l'unité de cluster d'hébergement | Règles d'adresse |
|---|---|
| Embed Cohere |
|
-
Pour augmenter le volume d'appels pris en charge par un cluster d'hébergement, augmentez le nombre d'instances en modifiant le cluster d'IA dédié. Reportez-vous à Mise à jour d'un cluster d'IA dédié.
-
Pour plus de 50 adresses par cluster, demandez une augmentation de la limite,
endpoint-per-dedicated-unit-count. Reportez-vous à Création d'une demande d'augmentation de limite et à Limites de service pour l'IA générative.
Tests de performances du cluster
Consultez les tests d'évaluation des performances du cluster Cohere Embed Multilingual Light Image 3 pour différents cas d'utilisation.
Dates de déblocage et de sortie
| Modèle | Date de lancement | Date de sortie à la demande | Date de retrait du mode dédié |
|---|---|---|---|
cohere.embed-multilingual-light-image-v3.0
|
2025-05-14 | Le mode à la demande n'est pas disponible pour ce modèle. | 2026-03-19 |
Pour obtenir la liste de toutes les lignes de temps du modèle et des détails de sortie, voir Mettre hors service les modèles.
Données d'entrée pour les incorporations de texte
Les données d'entrée nécessaires à la création d'intégrations de texte sont les suivantes :
- Vous pouvez ajouter des phrases, des expressions ou des paragraphes pour les incorporations, soit une phrase à la fois, soit en chargeant un fichier.
- Seuls les fichiers avec l'extension
.txtsont autorisés. - Si vous utilisez un fichier d'entrée, chaque phrase, expression ou paragraphe d'entrée dans le fichier doit être séparé par un caractère d'entrée à une nouvelle ligne.
- Un maximum de 96 entrées est autorisé pour chaque exécution.
- Dans la console, chaque entrée doit être inférieure à 512 jetons pour les modèles de texte uniquement.
- Si une entrée est trop longue, indiquez si le début ou la fin du texte doit être coupé dans la limite du jeton en définissant le paramètre Truncate sur Start ou End. Si une entrée dépasse la limite de jeton 512 et que le paramètre Truncate est défini sur None, un message d'erreur s'affiche.
- Pour les modèles de texte et d'image, vous pouvez avoir des fichiers et des entrées qui totalisent tous jusqu'à 128 000 jetons.
- Pour les modèles d'intégration de texte et d'image, tels que Cohere Embed English Image V3, vous pouvez soit ajouter du texte, soit ajouter une seule image. Pour l'image, vous pouvez utiliser une API. L'entrée d'image n'est pas disponible dans la console. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.
En savoir plus sur la création d'intégrations de texte dans OCI Generative AI.
Paramètre du modèle de plongement
Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.
- Tronquer
-
Permet d'indiquer si les sèmes de début ou de fin doivent être tronqués dans une phrase lorsque celle-ci dépasse le nombre maximal de sèmes autorisés. Par exemple, une phrase a 516 jetons, mais la taille maximale du jeton est de 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.