A propos de l'intégration des modèles dans l'IA générative

Les modèles d'intégration OCI Generative AI transforment chaque phrase, phrase ou paragraphe que vous saisissez en un tableau avec 384 ou 1024 chiffres, selon le modèle d'intégration que vous choisissez.

Vous pouvez utiliser ces plongements pour rechercher des similarités dans des expressions dont le contexte ou la catégorie est similaire. Les incorporations sont généralement stockées dans une base de données vectorielle. Les plongements sont principalement utilisés pour les recherches sémantiques, où la fonction de recherche se concentre sur le sens du texte recherché plutôt que sur les résultats basés sur des mots-clés.

Les modèles préentraînés suivants sont disponibles pour la création d'intégrations de texte en anglais et dans autres langues :

  • cohere.embed-english-v3.0
  • cohere.embed-multilingual-v3.0
  • cohere.embed-english-light-v3.0
  • cohere.embed-multilingual-light-v3.0

Pour visualiser les sorties avec des incorporations, les vecteurs de sortie sont projetés en deux dimensions et représentés sous forme de points dans la console Oracle Cloud. Les points qui sont proches les uns des autres correspondent à des expressions que le modèle considère comme similaires. Cliquez sur Exporter la sortie pour obtenir un tableau de 1024 vecteurs pour chaque incorporation enregistrée dans un fichier JSON.

Les cas d'emploi suivants sont idéaux pour les plongements textuels.

  • Recherche sémantique : effectuez des recherches dans les transcriptions d'appel, les sources de connaissances internes, etc.

  • Classification du texte : classez l'intention dans les journaux de discussion client et les tickets d'assistance.
  • Mise en cluster de texte : identifiez les sujets importants dans les commentaires client ou les nouvelles données.
  • Systèmes de recommandation : représentez les descriptions de podcast, par exemple, sous forme de fonctionnalité numérique à utiliser dans un modèle de recommandation.

Paramètre de modèle de fusion

Lorsque vous utilisez les modèles d'intégration, vous pouvez obtenir une sortie différente en modifiant le paramètre suivant.

Tronquer

Permet d'indiquer si les sèmes de début ou de fin doivent être tronqués dans une phrase lorsque celle-ci dépasse le nombre maximal de sèmes autorisés. Par exemple, une phrase a 516 jetons, mais la taille maximale de jeton est de 512. Si vous choisissez de tronquer la fin, les 4 derniers jetons de cette phrase sont coupés.