Métricas en agentes de IA generativa

Mediante el uso de métricas, puede supervisar los puntos finales en los agentes de IA generativa. Consulte los siguientes temas para obtener más información sobre estas métricas.

Métricas de punto final

En esta sección, se muestran las métricas de los puntos finales de agente en los agentes de IA generativa. Puede obtener las siguientes métricas en la página de detalles de un punto final.

Nombre mostrado de métrica Descripción
Número de llamadas Número de llamadas que ha procesado el agente alojado en este punto final
Tiempo total de procesamiento (ms) Tiempo total de procesamiento para que una llamada termine en milisegundos
Recuento de errores de servicio Número de llamadas con un error del servicio
Recuento de errores de cliente Número de llamadas con errores del cliente
Total de caracteres de entrada consumidos Número de caracteres de entrada que ha procesado el agente alojado en este punto final
Total de caracteres de salida producidos Número de caracteres de salida que ha procesado el agente alojado en este punto final
Número de rastreos de errores Número de rastreos con un error (esta opción se aplica si el rastreo está activado para este punto final).
Ratio de éxito Llamadas correctas divididas por el número total de llamadas
Consejo

En el servicio Generative AI Agents, la página de detalles de un punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final para obtener las siguientes opciones:
  • Ver consulta en el explorador de métricas
  • Copiar URL de gráfico
  • Copiar consulta en Monitoring Query Language (MQL)
  • Crear una alarma en esta consulta
  • Vista de Tabla

Visualización de consultas en el explorador de métricas

El explorador de métricas es un recurso del servicio Monitoring. Para obtener permiso para trabajar con los recursos del servicio Monitoring, solicite a un administrador que revise las políticas de IAM en Protección del servicio Monitoring y le otorgue el acceso adecuado para su rol.

Para cada una de las métricas de punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final y, a continuación, seleccione Ver consulta en el explorador de métricas. En la siguiente tabla se muestran los parámetros utilizados para las métricas de punto final en Monitoring Query Language (MQL).

Nombre mostrado de métrica Parámetro de métrica MQL
Número de llamadas TotalInvocationCount TotalInvocationCount[1m].count()
Tiempo total de procesamiento InvocationLatency InvocationLatency[1m].mean()
Recuento de errores de servicio ServerErrorCount ServerErrorCount[1m].count()
Recuento de errores de cliente ClientErrorCount ClientErrorCount[1m].count()
Total de caracteres de entrada consumidos InputCharactersCount InputCharactersCount[1m].sum()
Total de caracteres de salida producidos OutputCharactersCount[1m].sum() OutputCharactersCount[1m].sum()
Número de rastreos de errores ErrorTraceCount ErrorTraceCount[1m].sum()

La tasa de éxito se calcula como llamadas correctas divididas por el número total de llamadas con los siguientes MQL:

TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>", StatusCode="200"}.grouping().count()
/ TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>"}.grouping().count() * 100

Creación de una alarma para una métrica de punto final

Para cada una de las métricas de punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final. A continuación, seleccione Crear una alarma en esta consulta que se va a transportar a una página Crear alarma rellena en el servicio Monitoring. Rellene los campos restantes para definir una alarma para la métrica que ha seleccionado.