Cohere Embed 4 (New)

cohere.embed-v4.0 est un modèle multimodal qui peut créer des plongements de texte à partir d'entrées de texte ou d'une image. L'entrée d'image n'est pas disponible dans la console et vous devez utiliser l'API. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.

Disponible dans ces régions

  • Brésil - Est (Sao Paulo) (grappe dédiée à l'IA uniquement)
  • Allemagne - Centre (Francfort) (grappe dédiée à l'IA uniquement)
  • Inde - Sud (Hyderabad) (grappe dédiée à l'IA uniquement)
  • Japon - Centre (Osaka)
  • Centre de l'Arabie saoudite (Riyad)
  • Émirats arabes unis - Est (Dubaï) (grappe dédiée à l'IA uniquement)
  • Royaume-Uni - Sud (Londres) (grappe dédiée à l'IA uniquement)
  • États-Unis - Midwest (Chicago)

Principales fonctions

  • Mode
    • Entrez du texte ou une image, mais pas les deux.
    • Pour obtenir des plongements pour une image, une seule image est autorisée. Vous ne pouvez pas combiner le texte et l'image pour une même intégration. Entrée d'image au moyen de l'API uniquement.
  • Entrée et sortie
    • Dans la console, chaque entrée de texte doit comporter moins de 512 jetons et un maximum de 96 entrées par exécution.
    • Dans la trousse SDK et l'API, toutes les entrées peuvent ajouter jusqu'à 128 000 jetons par intégration par exécution.
    • Le modèle produit un vecteur à 1 536 dimensions pour chaque intégration.
  • Prise en charge de langues
    • Texte : Anglais ou multilingue.
    • Image : Anglais seulement.

Grappe d'IA dédiée pour le modèle

Pour atteindre un modèle au moyen d'une grappe dédiée à l'IA dans n'importe quelle région répertoriée, vous devez créer un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.

Modèle de base Cluster de réglage fin Grappe d'hébergement Informations sur la page de tarification Demander une augmentation de limite de grappe
  • Nom du modèle : Cohere Embed 4
  • Nom du modèle OCI : cohere.embed-v4.0
Non disponible pour le réglage fin
  • Taille de l'unité : Embed Cohere
  • Unités requises : 1
  • Nom du produit de la page Tarification : Embed Cohere - Dedicated
  • Pour l'hébergement, Multiplier le prix unitaire : x1
  • Nom de la limite : dedicated-unit-embed-cohere-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Conseil

  • Si vous n'avez pas suffisamment de limites de grappe dans votre location pour héberger un modèle intégré dans une grappe dédiée à l'IA, demandez que la limite dedicated-unit-embed-cohere-count augmente de 1.

  • Consultez les points de référence de performance de grappe Cohere Embed 4 pour différents cas d'utilisation.

Dates de lancement et de mise hors service

Modèle Date de version Date de mise hors service sur demande Date de mise hors service en mode dédié
cohere.embed-v4.0 2,025-7-3 Au moins 6 mois après la publication du 1er modèle de remplacement. Au moins 6 mois après la publication du 1er modèle de remplacement.
Important

Pour obtenir la liste de toutes les lignes de temps du modèle et les détails de mise hors service, voir Mise hors service des modèles.

Paramètre de modèle de plongement

Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.

Truncate

Indique s'il faut tronquer les jetons de début ou de fin d'une phrase, lorsque celle-ci dépasse le nombre maximal de jetons autorisés. Par exemple, une phrase comporte 516 jetons, mais la taille maximale du jeton est 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.