Scénario 5 : tests d'évaluation des incorporations de texte dans Generative AI

Le scénario d'intégration de texte imite la génération d'intégration dans le pipeline d'inclusion de données d'une base de données vectorielle.

Le scénario d'incorporation de texte s'applique uniquement aux modèles d'incorporation. Dans ce scénario, toutes les demandes ont la même taille, soit 96 documents, chacun avec 512 jetons. Un exemple serait un ensemble de fichiers PDF volumineux, chaque fichier contenant plus de 30 000 mots qu'un utilisateur veut ingérer dans une base de données vectorielle.

Passez en revue les termes utilisés dans les tests d'évaluation du cluster AI dédié de l'hébergement. Pour obtenir la liste des scénarios et leur description, reportez-vous à la rubrique Scénarios d'intégration de texte. Le scénario d'incorporation de texte est effectué dans la région suivante.

Est du Brésil (São Paulo)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,53 24
8 4,35 108
32 14,93 120
128 47,66 150
Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,25 24
8 4,33 120
32 14,94 144
128 49,21 198

Germany Central (Frankfurt)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,53 24
8 4,35 108
32 14,93 120
128 47,66 150
Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,25 24
8 4,33 120
32 14,94 144
128 49,21 198

UK South (London)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,53 24
8 4,35 108
32 14,93 120
128 47,66 150
Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,25 24
8 4,33 120
32 14,94 144
128 49,21 198

US Midwest (Chicago)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,53 24
8 4,35 108
32 14,93 120
128 47,66 150
Modèle : cohere.embed-english-light-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 1,75 30
8 3,93 108
32 14,44 113
128 48 120
Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 2,25 24
8 4,33 120
32 14,94 144
128 49,21 198
Modèle : cohere.embed-multilingual-light-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié
Accès simultané Latence au niveau de la demande (seconde) Débit au niveau de la demande (demande par minute) (RPM)
1 1,69 42
8 3,8 118
32 14,26 126
128 37,17 138