Détails des mesures dans le service d'IA générative

Vous pouvez surveiller les ressources du service d'intelligence artificielle générative pour OCI au moyen des mesures fournies dans ce service. Vous pouvez également utiliser le service de surveillance OCI pour créer des interrogations et des alarmes personnalisées afin de vous aviser lorsque ces mesures répondent aux déclencheurs spécifiés par l'alarme.

Hébergement des mesures d'une grappe d'IA dédiée

Cette section répertorie les mesures pour les grappes dédiées à l'IA pour l'hébergement. Les grappes dédiées au réglage de précision n'affichent pas de mesures.


Nom d'affichage de la mesure	Description
Utilisation	Pourcentage moyen d'utilisation de processeurs graphiques pour tous les processeurs graphiques de la grappe dédiée à l'IA
Nombre total d'entrées	Nombre de jetons d'entrée traités par les modèles de cette grappe dédiée à l'IA d'hébergement
Nombre total de sorties	Nombre de jetons de sortie traités par les modèles de cette grappe dédiée à l'IA d'hébergement

Vous pouvez obtenir les mesures précédentes à partir de la page de détails d'une grappe dédiée à l'IA hôte.

Mesures liées aux points d'extrémité

Cette section répertorie les mesures pour les points d'extrémité de modèle dans le service d'intelligence artificielle générative.


Nom d'affichage de la mesure	Description
Temps de traitement total	Temps de traitement total d'un appel
Nombre d'appels	Nombre de jetons d'entrée traités par le modèle hébergé sur ce point d'extrémité
Nombre d'erreurs de service	Nombre d'appels avec une erreur interne de service
Nombre d'erreurs de client	Nombre d'appels avec une erreur côté client
Nombre total d'entrées	Nombre de jetons d'entrée traités par le modèle hébergé sur ce point d'extrémité
Nombre total de sorties	Nombre de jetons de sortie traités par le modèle hébergé sur ce point d'extrémité
Taux de réussite des appels	Appels réussis divisés par le nombre total d'appels

Vous pouvez obtenir les mesures précédentes à partir de la page de détails d'un point d'extrémité.

Mesures pour les interrogations personnalisées

Vous pouvez créer des interrogations et des alarmes personnalisées pour la grappe du service d'intelligence artificielle générative et les mesures de point d'extrémité au moyen du service de surveillance.

Cette section répertorie les paramètres que vous pouvez utiliser pour créer des interrogations personnalisées pour les mesures du service d'intelligence artificielle générative à l'aide du service de surveillance.


Paramètre de mesure	Nom d'affichage	Description
`ClientErrorCount`	Nombre d'erreurs de client	Nombre d'appels avec une erreur côté client
`InputTokenCount`	Nombre total d'entrées	Nombre de jetons d'entrée traités par les modèles hébergés sur cette ressource
`InvocationLatency`	Temps de traitement total	Temps de traitement total d'un appel pour cette ressource
`OutputTokenCount`	Nombre total de sorties	Nombre de jetons de sortie traités par les modèles hébergés sur cette ressource
`ServerErrorCount`	Nombre d'erreurs de service	Nombre d'appels avec une erreur interne de service
`TotalInvocationCount`	Nombre d'appels	Nombre d'appels

Pour savoir comment créer ces interrogations personnalisées, voir Création d'une interrogation pour les mesures du service d'intelligence artificielle générative.

Documentation sur Oracle Cloud Infrastructure

Détails des mesures dans le service d'IA générative

Hébergement des mesures d'une grappe d'IA dédiée

Mesures liées aux points d'extrémité

Mesures pour les interrogations personnalisées