Créer des incorporations de texte dans Generative AI
Utilisez les modèles Cohere Embed dans OCI Generative AI pour convertir du texte à des incorporations vectorielles à utiliser dans les applications pour les recherches sémantiques, la classification du texte ou la mise en cluster de textes.
Les données d'entrée pour les incorporations de texte doivent répondre aux exigences suivantes :
- Vous pouvez ajouter des phrases, des expressions ou des paragraphes pour les incorporations, soit une phrase à la fois, soit en chargeant un fichier.
- Seuls les fichiers avec l'extension
.txt
sont autorisés. - Si vous utilisez un fichier d'entrée, chaque phrase, expression ou paragraphe d'entrée dans le fichier doit être séparé par un caractère d'entrée à une nouvelle ligne.
- Un maximum de 96 entrées est autorisé pour chaque exécution.
- Dans la console, chaque entrée doit être inférieure à 512 jetons pour les modèles de texte uniquement.
- Si une entrée est trop longue, indiquez si le début ou la fin du texte doit être coupé dans la limite du jeton en définissant le paramètre Truncate sur Start ou End. Si une entrée dépasse la limite de jeton 512 et que le paramètre Truncate est défini sur None, un message d'erreur s'affiche.
- Pour les modèles de texte et d'image, vous pouvez avoir des fichiers et des entrées qui totalisent tous jusqu'à 128 000 jetons.
- Pour les modèles d'intégration de texte et d'image, tels que Cohere Embed English Image V3, vous pouvez soit ajouter du texte, soit ajouter une seule image. Pour l'image, vous pouvez utiliser une API. L'entrée d'image n'est pas disponible dans la console. Pour l'API, entrez une image encodée base64 à chaque exécution. Par exemple, une image 512 x 512 est convertie en environ 1 610 jetons.
Pour créer des incorporations de texte, utilisez l'opération embed-text-result.
Entrez la commande suivante pour obtenir la liste des options permettant de créer des incorporations de texte.
oci generative-ai-inference embed-text-result embed-text -h
Pour obtenir la liste complète des paramètres et des valeurs des commandes de l'interface de ligne de commande OCI Generative AI, reportez-vous à Interface de ligne de commande d'inférence d'IA générative et à Interface de ligne de commande de gestion d'IA générative.
Exécutez l'opération EmbedText pour créer des incorporations de texte.
Pour plus d'informations sur l'utilisation de l'API et la signature des demandes, reportez-vous à la documentation relative à l'API REST et à Informations d'identification de sécurité. Pour plus d'informations sur les kits SDK, reportez-vous à Kits SDK et interface de ligne de commande.