Cohere Embed 4 (New)

cohere.embed-v4.0 est un modèle multimodal qui peut créer des incorporations de texte à partir d'entrées de texte ou d'une image. L'entrée d'image n'est pas disponible dans la console et vous devez utiliser l'API. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.

Disponible dans ces régions

  • Est du Brésil (São Paulo) (cluster d'IA dédié uniquement)
  • Allemagne centrale (Francfort) (cluster d'IA dédié uniquement)
  • Sud de l'Inde (Hyderabad) (cluster d'IA dédié uniquement)
  • Centre du Japon (Osaka)
  • Centre de l'Arabie saoudite (Riyad)
  • Est des Émirats arabes unis (Dubaï) (cluster d'IA dédié uniquement)
  • Sud du Royaume-Uni (Londres) (cluster d'IA dédié uniquement)
  • Midwest des Etats-Unis (Chicago)

Principales fonctionnalités

  • Mode
    • Entrez du texte ou une image, mais pas les deux.
    • Pour obtenir des incorporations pour une image, une seule image est autorisée. Vous ne pouvez pas combiner texte et image pour la même intégration. Saisie d'image via l'API uniquement.
  • Entrée et sortie
    • Dans la console, chaque entrée de texte doit être inférieure à 512 jetons et 96 entrées au maximum par exécution.
    • Dans le kit SDK et l'API, toutes les entrées peuvent additionner jusqu'à 128 000 jetons par intégration par exécution.
    • Le modèle délivre un vecteur de 1 536 dimensions pour chaque incorporation.
  • Prise en charge des langues
    • Texte : anglais ou multilingue.
    • Image : anglais uniquement.

Cluster d'IA dédié pour le modèle

Pour atteindre un modèle via un cluster d'IA dédié dans une région répertoriée, vous devez créer une adresse pour ce modèle sur un cluster d'IA dédié. Pour connaître la taille d'unité de cluster correspondant à ce modèle, reportez-vous au tableau suivant.

Modèle de base Cluster de réglage fin Cluster d'hébergement Informations sur la page de tarification Demander une augmentation de limite de cluster
  • Nom du modèle : Cohere Embed 4
  • Nom du modèle OCI : cohere.embed-v4.0
Non disponible pour le réglage fin
  • Taille d'unité : Embed Cohere
  • Unités obligatoires : 1
  • Nom du produit de la page de tarification : Embed Cohere - Dedicated
  • Pour l'Hébergement, Multiplier le Prix Unitaire : x1
  • Nom de la limite : dedicated-unit-embed-cohere-count
  • Pour l'hébergement, demandez une augmentation de limite de : 1
Conseil

  • Si votre location ne dispose pas de suffisamment de limites de cluster pour héberger un modèle Embed sur un cluster d'IA dédié, demandez une augmentation de 1 de la limite dedicated-unit-embed-cohere-count.

  • Consultez les tests d'évaluation des performances du cluster Cohere Embed 4 pour différents cas d'utilisation.

Dates de déblocage et de sortie

Modèle Date de lancement Date de sortie à la demande Date de retrait du mode dédié
cohere.embed-v4.0 2 025-7-3 Au moins 6 mois après la publication du 1er modèle de remplacement. Au moins 6 mois après la publication du 1er modèle de remplacement.
Important

Pour obtenir la liste de toutes les lignes de temps du modèle et des détails de sortie, voir Mettre hors service les modèles.

Paramètre du modèle de plongement

Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.

Tronquer

Permet d'indiquer si les sèmes de début ou de fin doivent être tronqués dans une phrase lorsque celle-ci dépasse le nombre maximal de sèmes autorisés. Par exemple, une phrase a 516 jetons, mais la taille maximale du jeton est de 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.