Métricas en agentes de IA generativa
Mediante el uso de métricas, puede supervisar los puntos finales en los agentes de IA generativa. Consulte los siguientes temas para obtener más información sobre estas métricas.
Métricas de punto final
En esta sección, se muestran las métricas de los puntos finales de agente en los agentes de IA generativa. Puede obtener las siguientes métricas en la página de detalles de un punto final.
Nombre mostrado de métrica | Descripción |
---|---|
Número de llamadas | Número de llamadas que ha procesado el agente alojado en este punto final |
Tiempo total de procesamiento (ms) | Tiempo total de procesamiento para que una llamada termine en milisegundos |
Recuento de errores de servicio | Número de llamadas con un error del servicio |
Recuento de errores de cliente | Número de llamadas con errores del cliente |
Total de caracteres de entrada consumidos | Número de caracteres de entrada que ha procesado el agente alojado en este punto final |
Total de caracteres de salida producidos | Número de caracteres de salida que ha procesado el agente alojado en este punto final |
Número de rastreos de errores | Número de rastreos con un error (esta opción se aplica si el rastreo está activado para este punto final). |
Ratio de éxito | Llamadas correctas divididas por el número total de llamadas |
En el servicio Generative AI Agents, la página de detalles de un punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final para obtener las siguientes opciones:
- Ver consulta en el explorador de métricas
- Copiar URL de gráfico
- Copiar consulta en Monitoring Query Language (MQL)
- Crear una alarma en esta consulta
- Vista de Tabla
Visualización de consultas en el explorador de métricas
El explorador de métricas es un recurso del servicio Monitoring. Para obtener permiso para trabajar con los recursos del servicio Monitoring, solicite a un administrador que revise las políticas de IAM en Protección del servicio Monitoring y le otorgue el acceso adecuado para su rol.
Para cada una de las métricas de punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final y, a continuación, seleccione Ver consulta en el explorador de métricas. En la siguiente tabla se muestran los parámetros utilizados para las métricas de punto final en Monitoring Query Language (MQL).
Nombre mostrado de métrica | Parámetro de métrica | MQL |
---|---|---|
Número de llamadas | TotalInvocationCount |
TotalInvocationCount[1m].count() |
Tiempo total de procesamiento | InvocationLatency |
InvocationLatency[1m].mean() |
Recuento de errores de servicio | ServerErrorCount |
ServerErrorCount[1m].count() |
Recuento de errores de cliente | ClientErrorCount |
ClientErrorCount[1m].count() |
Total de caracteres de entrada consumidos | InputCharactersCount |
InputCharactersCount[1m].sum() |
Total de caracteres de salida producidos | OutputCharactersCount[1m].sum() |
OutputCharactersCount[1m].sum() |
Número de rastreos de errores | ErrorTraceCount |
ErrorTraceCount[1m].sum() |
La tasa de éxito se calcula como llamadas correctas divididas por el número total de llamadas con los siguientes MQL:
TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>", StatusCode="200"}.grouping().count()
/ TotalInvocationCount[1m]{resourceId = "<endpoint-OCID>"}.grouping().count() * 100
Creación de una alarma para una métrica de punto final
Para cada una de las métricas de punto final, seleccione el menú Opciones en cada uno de los gráficos de métricas de punto final. A continuación, seleccione Crear una alarma en esta consulta que se va a transportar a una página Crear alarma rellena en el servicio Monitoring. Rellene los campos restantes para definir una alarma para la métrica que ha seleccionado.