Mesures dans les agents d'intelligence artificielle générative

En utilisant des mesures, vous pouvez surveiller les points d'extrémité dans les agents IA génératifs. Consultez les rubriques suivantes pour plus d'informations sur ces mesures.

Mesures liées aux points d'extrémité

Cette section répertorie les mesures pour les points d'extrémité d'agent dans les agents IA génératifs. Vous pouvez obtenir les mesures suivantes dans la page de détails d'un point d'extrémité.

Nom d'affichage de la mesure Description
Nombre d'appels Nombre d'appels traités par l'agent hébergé sur ce point d'extrémité
Temps total de traitement (ms) Temps de traitement total d'un appel en millisecondes
Nombre d'erreurs de service Nombre d'appels avec une erreur du côté du service
Nombre d'erreurs de client Nombre d'appels avec une erreur du côté client
Nombre total de caractères d'entrée consommés Nombre de caractères d'entrée traités par l'agent hébergé sur ce point d'extrémité
Nombre total de caractères de sortie produits Nombre de caractères de sortie traités par l'agent hébergé sur ce point d'extrémité
Nombre de traces d'erreur Nombre de traces avec une erreur (Cette option s'applique si le traçage est activé pour ce point d'extrémité.)
Taux de réussite Appels réussis divisés par le nombre total d'appels
Conseil

Dans le service Agents d'intelligence artificielle générative, page de détails d'un point d'extrémité, sélectionnez le menu Options dans chacun des graphiques de mesure de point d'extrémité pour obtenir les options suivantes :
  • Voir l'interrogation dans l'explorateur des mesures
  • Copier l'URL du graphique
  • Copier l'interrogation dans MQL
  • Créer une alarme sur cette interrogation
  • Vue en table

Consultation de l'interrogation dans l'explorateur de mesures

L'explorateur de mesures est une ressource du service de surveillance. Pour obtenir l'autorisation d'utiliser les ressources du service de surveillance, demandez à un administrateur de vérifier les politiques IAM sous Sécurisation du service de surveillance et de vous accorder l'accès approprié à votre rôle.

Pour chacune des mesures de point d'extrémité, sélectionnez le menu Options dans chacun des graphiques de mesure de point d'extrémité, puis sélectionnez Voir l'interrogation dans l'explorateur de mesures. Le tableau suivant affiche les paramètres utilisés pour les mesures de point d'extrémité dans le langage MQL.

Nom d'affichage de la mesure Paramètre de mesure MQL
Nombre d'appels TotalInvocationCount TotalInvocationCount[1m].count()
Temps de traitement total InvocationLatency InvocationLatency[1m].mean()
Nombre d'erreurs de service ServerErrorCount ServerErrorCount[1m].count()
Nombre d'erreurs de client ClientErrorCount ClientErrorCount[1m].count()
Nombre total de caractères d'entrée consommés InputCharactersCount InputCharactersCount[1m].sum()
Nombre total de caractères de sortie produits OutputCharactersCount[1m].sum() OutputCharactersCount[1m].sum()
Nombre de traces d'erreur ErrorTraceCount ErrorTraceCount[1m].sum()

Le taux de réussite est calculé comme les appels réussis divisés par le nombre total d'appels avec le MQL suivant :

TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>", StatusCode="200"}.grouping().count()
/ TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>"}.grouping().count() * 100

Création d'une alarme pour une mesure de point d'extrémité

Pour chacune des mesures de point d'extrémité, sélectionnez le menu Options dans chacun des graphiques de mesure de point d'extrémité. Sélectionnez ensuite Créer une alarme sur cette interrogation pour être transporté vers une page Créer une alarme alimentée dans le service de surveillance. Remplissez les autres champs pour définir une alarme pour la mesure que vous avez sélectionnée.