Scénario 5 : tests d'évaluation des incorporations de texte dans Generative AI
Le scénario d'intégration de texte imite la génération d'intégration dans le pipeline d'inclusion de données d'une base de données vectorielle.
Le scénario d'incorporation de texte s'applique uniquement aux modèles d'incorporation. Dans ce scénario, toutes les demandes ont la même taille, soit 96 documents, chacun avec 512 jetons. Un exemple serait un ensemble de fichiers PDF volumineux, chaque fichier contenant plus de 30 000 mots qu'un utilisateur veut ingérer dans une base de données vectorielle.
Passez en revue les termes utilisés dans les tests d'évaluation du cluster AI dédié de l'hébergement. Pour obtenir la liste des scénarios et leur description, reportez-vous à la rubrique Scénarios d'intégration de texte. Le scénario d'incorporation de texte est effectué dans la région suivante.
Est du Brésil (São Paulo)
- Modèle :
cohere.embed-english-v3.0
hébergé sur une unité Embed Cohere d'un cluster AI dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,53 24 8 4,35 108 32 14,93 120 128 47,66 150 - Modèle :
cohere.embed-multilingual-v3.0
hébergé sur une unité Embed Cohere d'un cluster AI dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,25 24 8 4,33 120 32 14,94 144 128 49,21 198
Germany Central (Frankfurt)
- Modèle :
cohere.embed-english-v3.0
hébergé sur une unité Embed Cohere d'un cluster d'IA dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,53 24 8 4,35 108 32 14,93 120 128 47,66 150 - Modèle :
cohere.embed-multilingual-v3.0
hébergé sur une unité Embed Cohere d'un cluster d'IA dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,25 24 8 4,33 120 32 14,94 144 128 49,21 198
UK South (London)
- Modèle :
cohere.embed-english-v3.0
hébergé sur une unité Embed Cohere d'un cluster d'IA dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,53 24 8 4,35 108 32 14,93 120 128 47,66 150 - Modèle :
cohere.embed-multilingual-v3.0
hébergé sur une unité Embed Cohere d'un cluster d'IA dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,25 24 8 4,33 120 32 14,94 144 128 49,21 198
US Midwest (Chicago)
- Modèle :
cohere.embed-english-v3.0
hébergé sur une unité Embed Cohere d'un cluster d'IA dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,53 24 8 4,35 108 32 14,93 120 128 47,66 150 - Modèle :
cohere.embed-english-light-v3.0
hébergé sur une unité Embed Cohere d'un cluster AI dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 1,75 30 8 3,93 108 32 14,44 113 128 48 120 - Modèle :
cohere.embed-multilingual-v3.0
hébergé sur une unité Embed Cohere d'un cluster d'IA dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 2,25 24 8 4,33 120 32 14,94 144 128 49,21 198 - Modèle :
cohere.embed-multilingual-light-v3.0
hébergé sur une unité Embed Cohere d'un cluster AI dédié -
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM) 1 1,69 42 8 3,8 118 32 14,26 126 128 37,17 138