Métricas en agentes de IA generativa

Mediante el uso de métricas, puede supervisar los puntos finales en los agentes de IA generativa. Consulte los siguientes temas para obtener más información sobre estas métricas.

Métricas de punto final

En esta sección, se muestran las métricas de puntos finales de agente en agentes de IA generativa. Puede obtener las siguientes métricas en la página de detalles de un punto final.


Nombre mostrado de métrica	Descripción
Número de llamadas	Número de llamadas que ha procesado el agente alojado en este punto final
Tiempo total de procesamiento (ms)	Tiempo total de procesamiento para que una llamada termine en milisegundos
Recuento de errores de servicio	Número de llamadas con un error del servicio
Recuento de errores de cliente	Número de llamadas con errores del cliente
Total de caracteres de entrada consumidos	Número de caracteres de entrada que ha procesado el agente alojado en este punto final
Total de caracteres de salida producidos	Número de caracteres de salida que ha procesado el agente alojado en este punto final
Número de rastreos de errores	Número de rastreos con un error (esta opción se aplica si el rastreo está activado para este punto final).
Ratio de éxito	Llamadas correctas divididas por el número total de llamadas

Consejo

En el servicio Agentes de IA generativa, la página de detalles de un punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final para obtener las siguientes opciones:

Ver consulta en el explorador de métricas
Copiar URL de gráfico
Copiar consulta en Monitoring Query Language (MQL)
Crear una alarma en esta consulta
Vista de Tabla

Visualización de consultas en el explorador de métricas

El explorador de métricas es un recurso del servicio Monitoring. Para obtener permiso para trabajar con los recursos del servicio Monitoring, solicite a un administrador que revise las políticas de IAM en Protección del servicio Monitoring y le otorgue el acceso adecuado para su rol.

Para cada una de las métricas de punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final y, a continuación, seleccione Ver consulta en el explorador de métricas. En la siguiente tabla se muestran los parámetros utilizados para las métricas de punto final en Monitoring Query Language (MQL).


Nombre mostrado de métrica	Parámetro de métrica	MQL
Número de llamadas	`TotalInvocationCount`	`TotalInvocationCount[1m].count()`
Tiempo total de procesamiento	`InvocationLatency`	`InvocationLatency[1m].mean()`
Recuento de errores de servicio	`ServerErrorCount`	`ServerErrorCount[1m].count()`
Recuento de errores de cliente	`ClientErrorCount`	`ClientErrorCount[1m].count()`
Total de caracteres de entrada consumidos	`InputCharactersCount`	`InputCharactersCount[1m].sum()`
Total de caracteres de salida producidos	`OutputCharactersCount[1m].sum()`	`OutputCharactersCount[1m].sum()`
Número de rastreos de errores	`ErrorTraceCount`	`ErrorTraceCount[1m].sum()`

La tasa de éxito se calcula como llamadas correctas divididas por el número total de llamadas con los siguientes MQL:

TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>", StatusCode="200"}.grouping().count()
/ TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>"}.grouping().count() * 100

Creación de una alarma para una métrica de punto final

Para cada una de las métricas de punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final. A continuación, seleccione Crear una alarma en esta consulta que se va a transportar a una página Crear alarma rellena en el servicio Monitoring. Rellene los campos restantes para definir una alarma para la métrica que ha seleccionado.

Documentación de Oracle Cloud Infrastructure

Métricas en agentes de IA generativa

Métricas de punto final

Visualización de consultas en el explorador de métricas

Creación de una alarma para una métrica de punto final