Scénario 5 : tests d'évaluation des incorporations de texte dans Generative AI

Le scénario d'intégration de texte imite la génération d'intégration dans le pipeline d'inclusion de données d'une base de données vectorielle.

Le scénario d'incorporation de texte s'applique uniquement aux modèles d'incorporation. Dans ce scénario, toutes les demandes ont la même taille, soit 96 documents, chacun avec 512 jetons. Un exemple serait un ensemble de fichiers PDF volumineux, chaque fichier contenant plus de 30 000 mots qu'un utilisateur veut ingérer dans une base de données vectorielle.

Passez en revue les termes utilisés dans les tests d'évaluation du cluster AI dédié de l'hébergement. Pour obtenir la liste des scénarios et leur description, reportez-vous à la rubrique Scénarios d'intégration de texte. Le scénario d'incorporation de texte est effectué dans la région suivante.

Est du Brésil (São Paulo)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,53	24
8	4,35	108
32	14,93	120
128	47,66	150

Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,25	24
8	4,33	120
32	14,94	144
128	49,21	198

Germany Central (Frankfurt)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,53	24
8	4,35	108
32	14,93	120
128	47,66	150

Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,25	24
8	4,33	120
32	14,94	144
128	49,21	198

UK South (London)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,53	24
8	4,35	108
32	14,93	120
128	47,66	150

Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,25	24
8	4,33	120
32	14,94	144
128	49,21	198

US Midwest (Chicago)

Modèle : cohere.embed-english-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,53	24
8	4,35	108
32	14,93	120
128	47,66	150

Modèle : cohere.embed-english-light-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	1,75	30
8	3,93	108
32	14,44	113
128	48	120

Modèle : cohere.embed-multilingual-v3.0 hébergé sur une unité Embed Cohere d'un cluster d'IA dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	2,25	24
8	4,33	120
32	14,94	144
128	49,21	198

Modèle : cohere.embed-multilingual-light-v3.0 hébergé sur une unité Embed Cohere d'un cluster AI dédié


Accès simultané	Latence au niveau de la demande (seconde)	Débit au niveau de la demande (demande par minute) (RPM)
1	1,69	42
8	3,8	118
32	14,26	126
128	37,17	138

Documentation Oracle Cloud Infrastructure

Scénario 5 : tests d'évaluation des incorporations de texte dans Generative AI

Est du Brésil (São Paulo)

Germany Central (Frankfurt)

UK South (London)

US Midwest (Chicago)