Mesures dans les agents d'intelligence artificielle générative
En utilisant des mesures, vous pouvez surveiller les points d'extrémité dans les agents IA génératifs. Consultez les rubriques suivantes pour plus d'informations sur ces mesures.
Mesures liées aux points d'extrémité
Cette section répertorie les mesures pour les points d'extrémité d'agent dans les agents IA génératifs. Vous pouvez obtenir les mesures suivantes dans la page de détails d'un point d'extrémité.
Nom d'affichage de la mesure | Description |
---|---|
Nombre d'appels | Nombre d'appels traités par l'agent hébergé sur ce point d'extrémité |
Temps total de traitement (ms) | Temps de traitement total d'un appel en millisecondes |
Nombre d'erreurs de service | Nombre d'appels avec une erreur du côté du service |
Nombre d'erreurs de client | Nombre d'appels avec une erreur du côté client |
Nombre total de caractères d'entrée consommés | Nombre de caractères d'entrée traités par l'agent hébergé sur ce point d'extrémité |
Nombre total de caractères de sortie produits | Nombre de caractères de sortie traités par l'agent hébergé sur ce point d'extrémité |
Nombre de traces d'erreur | Nombre de traces avec une erreur (Cette option s'applique si le traçage est activé pour ce point d'extrémité.) |
Taux de réussite | Appels réussis divisés par le nombre total d'appels |
Dans le service Agents d'intelligence artificielle générative, page de détails d'un point d'extrémité, sélectionnez le menu Options dans chacun des graphiques de mesure de point d'extrémité pour obtenir les options suivantes :
- Voir l'interrogation dans l'explorateur des mesures
- Copier l'URL du graphique
- Copier l'interrogation dans MQL
- Créer une alarme sur cette interrogation
- Vue en table
Consultation de l'interrogation dans l'explorateur de mesures
L'explorateur de mesures est une ressource du service de surveillance. Pour obtenir l'autorisation d'utiliser les ressources du service de surveillance, demandez à un administrateur de vérifier les politiques IAM sous Sécurisation du service de surveillance et de vous accorder l'accès approprié à votre rôle.
Pour chacune des mesures de point d'extrémité, sélectionnez le menu Options dans chacun des graphiques de mesure de point d'extrémité, puis sélectionnez Voir l'interrogation dans l'explorateur de mesures. Le tableau suivant affiche les paramètres utilisés pour les mesures de point d'extrémité dans le langage MQL.
Nom d'affichage de la mesure | Paramètre de mesure | MQL |
---|---|---|
Nombre d'appels | TotalInvocationCount |
TotalInvocationCount[1m].count() |
Temps de traitement total | InvocationLatency |
InvocationLatency[1m].mean() |
Nombre d'erreurs de service | ServerErrorCount |
ServerErrorCount[1m].count() |
Nombre d'erreurs de client | ClientErrorCount |
ClientErrorCount[1m].count() |
Nombre total de caractères d'entrée consommés | InputCharactersCount |
InputCharactersCount[1m].sum() |
Nombre total de caractères de sortie produits | OutputCharactersCount[1m].sum() |
OutputCharactersCount[1m].sum() |
Nombre de traces d'erreur | ErrorTraceCount |
ErrorTraceCount[1m].sum() |
Le taux de réussite est calculé comme les appels réussis divisés par le nombre total d'appels avec le MQL suivant :
TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>", StatusCode="200"}.grouping().count()
/ TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>"}.grouping().count() * 100
Création d'une alarme pour une mesure de point d'extrémité
Pour chacune des mesures de point d'extrémité, sélectionnez le menu Options dans chacun des graphiques de mesure de point d'extrémité. Sélectionnez ensuite Créer une alarme sur cette interrogation pour être transporté vers une page Créer une alarme alimentée dans le service de surveillance. Remplissez les autres champs pour définir une alarme pour la mesure que vous avez sélectionnée.