Detalles de métricas en Generative AI

Puede supervisar los recursos de OCI Generative AI a través de las métricas proporcionadas en este servicio. También puede utilizar el servicio OCI Monitoring para crear consultas personalizadas y alarmas que le notifiquen cuando estas métricas cumplan los disparadores especificados por la alarma.

Alojamiento de Métricas de Cluster de IA Dedicada

En esta sección, se muestran las métricas de los clusters de AI dedicados de alojamiento. Los clusters dedicados de ajuste no muestran métricas.


Nombre mostrado de métrica	Descripción
Utilización	Porcentaje medio de utilización de GPU en todas las GPU del cluster de IA dedicado
Número total de entrada	Número de tokens de entrada que han procesado los modelos de este cluster de AI dedicado de alojamiento
Número total de salida	Número de tokens de salida que han procesado los modelos de este cluster de AI dedicado de alojamiento

Puede obtener las métricas anteriores de la página de detalles de un cluster de AI dedicado de alojamiento.

Métricas de punto final

En esta sección, se muestran las métricas para los puntos finales de modelo en la IA generativa.


Nombre mostrado de métrica	Descripción
Tiempo total de procesamiento	Tiempo total de procesamiento para que una llamada termine
Número de llamadas	Número de tokens de entrada que ha procesado el modelo alojado en este punto final
Recuento de errores de servicio	Número de llamadas con error interno del servicio
Recuento de errores de cliente	Número de llamadas con errores del cliente
Número total de entrada	Número de tokens de entrada que ha procesado el modelo alojado en este punto final
Número total de salida	Número de tokens de salida que ha procesado el modelo alojado en este punto final
Ratio de éxito de las llamadas	Llamadas correctas divididas por el número total de llamadas

Puede obtener las métricas anteriores de la página de detalles de un punto final.

Métricas para consultas personalizadas

Puede crear consultas y alarmas personalizadas para el cluster de IA generativa y las métricas de punto final mediante el servicio Monitoring.

En esta sección se muestran los parámetros que puede utilizar para crear consultas personalizadas para métricas de IA generativa mediante el servicio Monitoring.


Parámetro de métrica	Nombre mostrado	Descripción
`ClientErrorCount`	Recuento de errores de cliente	Número de llamadas con errores del cliente
`InputTokenCount`	Número total de entrada	Número de tokens de entrada que han procesado los modelos alojados en este recurso
`InvocationLatency`	Tiempo total de procesamiento	Tiempo total de procesamiento para que una llamada termine en este recurso
`OutputTokenCount`	Número total de salida	Número de tokens de salida que han procesado los modelos alojados en este recurso
`ServerErrorCount`	Recuento de errores de servicio	Número de llamadas con error interno del servicio
`TotalInvocationCount`	Número de llamadas	Número de llamadas

Para conocer los pasos sobre cómo crear estas consultas personalizadas, consulte Creación de una consulta para métricas de IA generativa.

Documentación de Oracle Cloud Infrastructure

Detalles de métricas en Generative AI

Alojamiento de Métricas de Cluster de IA Dedicada

Métricas de punto final

Métricas para consultas personalizadas