Métricas de instancias informáticas
Puede supervisar el estado, la capacidad y el rendimiento de sus instancias informáticas utilizando métricas, alarmas y notificaciones.
En este tema se describen las métricas emitidas por el espacio de nombre de métrica oci_computeagent
(el plugin Compute Instance Monitoring en las instancias informáticas).
Puede ver estas métricas para instancias informáticas individuales y para todas las instancias de un pool de instancias.
Recursos: instancias informáticas habilitadas para la supervisión.
Visión general de las métricas para una instancia y recursos relacionados
En esta sección se ofrece una visión general de los diferentes tipos de métricas disponibles para una instancia y sus dispositivos de almacenamiento y red. Consulte el siguiente diagrama y tabla para obtener un resumen.
Espacio de nombre de métrica | ID de recurso | Ubicación de medición | Métricas disponibles |
---|---|---|---|
oci_computeagent
|
OCID de instancia | En la instancia. Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn se agrega a todas las VNIC asociadas a la instancia. |
Consulte Métricas disponibles: oci_computeagent. |
oci_blockstore
|
OCID de volumen de inicio o de bloque | Por el servicio Volumen de bloque. Las métricas son para un volumen individual (volumen de inicio o volumen de bloque). | Consulte Métricas de volumen de bloque. |
oci_vcn
|
VNIC OCID | Por el servicio Redes. Las métricas son para una VNIC individual. |
Consulte Métricas de VNIC. |
Antes de empezar
- Políticas de IAM: para supervisar los recursos, debe contar con el tipo necesario de acceso en una política escrita por un administrador, tanto si utiliza la consola como la API de REST con un SDK, CLI u otra herramienta. La política debe proporcionar acceso a los servicios de supervisión, así como a los recursos que se están supervisando. Si intenta realizar una acción y obtiene un mensaje que indica que no tiene permiso o que no está autorizado, póngase en contacto con el administrador para averiguar qué tipo de acceso se le ha otorgado y en qué compartimento debe trabajar. Para obtener más información sobre las autorizaciones de usuario para la supervisión, consulte Políticas de IAM.
- Existen métricas en la supervisión: los recursos que desea supervisar deben emitir métricas al servicio de supervisión.
- Instancias de Compute: para emitir métricas, el plugin de supervisión de instancias de Compute debe estar activado en la instancia y los plugins deben estar en ejecución. La instancia también debe tener un gateway de servicio o una dirección IP pública para enviar las métricas al servicio Monitoring. Para obtener más información, consulte Habilitación de supervisión de instancias de Compute.
Métricas disponibles: oci_computeagent
Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento de las instancias informáticas. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.
Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead
se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn
se agrega a todas las VNIC asociadas a la instancia.
Para las métricas emitidas por el espacio de nombres de métrica oci_computeagent
, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.
También puede utilizar el servicio Supervisión para crear consultas personalizadas.
Cada métrica incluye las siguientes dimensiones:
- availabilityDomain
- El dominio de disponibilidad en el que reside la instancia.
- faultDomain
- El dominio de errores en el que reside la instancia.
- imageId
- La OCID de la imagen para la instancia.
- instancePoolId
- El pool de instancias al que pertenece la instancia.
- region
- La región en la que reside la instancia.
- resourceDisplayName
- Nombre fácil de recordar de la instancia.
- resourceId
- El OCID de la instancia.
- unidad
- La unidad de la instancia.
Métrica | Nombre mostrado de la métrica | Unidad | Descripción | Dimensiones |
---|---|---|---|---|
CpuUtilization
|
Utilización de CPU | porcentaje |
Nivel de actividad de la CPU. Expresado como porcentaje del tiempo total. Para pools de instancias, el valor se calcula entre todas las instancias del pool. |
|
DiskBytesRead 1, 3 |
Bytes de lectura de disco | bytes | Rendimiento de lectura. Se expresa como bytes leídos por intervalo. | |
DiskBytesWritten 1, 3 |
Bytes de escritura de disco | bytes | Rendimiento de escritura. Se expresa como bytes escritos por intervalo. | |
DiskIopsRead 1, 3 |
E/S de lectura de disco | operaciones | Nivel de actividad de lecturas de E/S. Se expresa como lecturas por intervalo. | |
DiskIopsWritten 1, 3 |
E/S de escritura de disco | operaciones | Nivel de actividad de escrituras de E/S. Expresado como escrituras por intervalo. | |
LoadAverage |
Media de carga | Número de procesos | Carga media del sistema calculada en un período de 1 minuto. | |
MemoryAllocationStalls |
Paralizaciones de asignaciones de memoria | número de paralizaciones | Número de veces que se ha llamado directamente a una reclamación de página. | |
MemoryUtilization 1 |
Uso de memoria | porcentaje |
Espacio actualmente en uso. Medido por páginas. Expresado como porcentaje de páginas utilizadas. Para pools de instancias, el valor se calcula entre todas las instancias del pool. |
|
NetworksBytesIn 1, 2 |
Bytes de recepción de red | bytes |
Rendimiento de recepción de red. Expresado como bytes recibidos. |
|
NetworksBytesOut 1, 2
|
Bytes de transmisión de red | bytes | Rendimiento de transmisión de red. Expresado como bytes transmitidos. | |
1Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. 2 El servicio Networking proporciona más métricas (en el espacio de nombres de métrica 3 El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica |
Métricas disponibles: gpu_infrastructure_health
Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento global de las instancias. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.
Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead
se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn
se agrega a todas las VNIC asociadas a la instancia.
Para las métricas emitidas por el espacio de nombres de métrica gpu_infrastructure_health
, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.
También puede utilizar el servicio Supervisión para crear consultas personalizadas.
Cada métrica incluye las siguientes dimensiones:
- componente
- GPU o rdma_nic
- registro de hora
- Hora UTC en la que se emite la carga útil/latido
- versión
- Número de versión de carga útil para compatibilidad
Métrica | Nombre mostrado de la métrica | Unidad | Descripción | Dimensiones |
---|---|---|---|---|
GpuUtilization
|
Utilización de GPU | porcentaje |
Nivel de actividad de la GPU. Expresado como porcentaje del tiempo total. Para pools de instancias, el valor se calcula entre todas las instancias del pool. |
|
GpuMemoryUtilization |
Uso de memoria de GPU | porcentaje | Porcentaje del recurso de memoria de GPU en uso. | |
GpuPowerDraw |
Consumo de energía de GPU | entero | Cantidad de energía de GPU utilizada. | |
GpuTemperature |
Temperatura de GPU | entero | La temperatura de la GPU informada. | |
GpuEccSingleBitErrors |
Errores de un bit de GPU | entero | Número de errores de ECC de un solo bit de GPU informados. | |
GpuEccDoubleBitErrors |
Errores de dos bits de GPU | entero | Número de errores de ECC de doble bit de GPU informados. | |
1Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. 2 El servicio Networking proporciona más métricas (en el espacio de nombres de métrica 3 El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica |
Métricas disponibles: rdma_infrastructure_health
Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento de las instancias informáticas. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.
Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead
se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn
se agrega a todas las VNIC asociadas a la instancia.
Para las métricas emitidas por el espacio de nombres de métrica rdma_infrastructure_health
, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.
También puede utilizar el servicio Supervisión para crear consultas personalizadas.
Cada métrica incluye las siguientes dimensiones:
- componente
- GPU o rdma_nic
- registro de hora
- Hora UTC en la que se emite la carga útil/latido
- versión
- Número de versión de carga útil para compatibilidad
Métrica | Nombre mostrado de la métrica | Unidad | Descripción | Dimensiones |
---|---|---|---|---|
RdmaTxBytes
|
bytes de transmisión de red agregados de RDMA | bytes | bytes transmitidos en la interfaz de RDMA. |
|
RdmaRxBytes |
bytes de recepción de red agregados de RDMA | bytes | bytes recibidos en la interfaz de RDMA. | |
RdmaTxPackets |
Paquetes de transmisión de red agregados de RDMA | entero | Número de paquetes transmitidos en la interfaz de RDMA. | |
RdmaRxPackets |
Paquetes de recepción de red agregada de RDMA | entero | Número de paquetes recibidos en la interfaz de RDMA. | |
1Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. 2 El servicio Networking proporciona más métricas (en el espacio de nombres de métrica 3 El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica |
Uso de la Consola
- Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
- Haga clic en la instancia en la que está interesado.
- En Recursos, haga clic en Métricas.
-
En la lista Espacio de nombre de métrica, seleccione oci_computeagent.
En la página Métricas se muestra un conjunto predeterminado de gráficos para la instancia actual.
¿No ve ningún gráfico de métricas para la instancia?Si no ve ningún gráfico de métricas, es posible que la instancia no emita métricas. Consulte las siguientes causas y resoluciones posibles.
Causa posible Cómo comprobarlo Solución El plugin Compute Instance Monitoring está desactivado en la instancia o los plugins se han parado. Revise las propiedades de la instancia. Active el plugin de Compute Instance Monitoring e inicie todos los plugins. La instancia no puede acceder al servicio de supervisión porque su VCN no utiliza Internet. Revise la dirección IP de la instancia. Si no es pública, se necesita una puerta de enlace de servicio. Configure una puerta de enlace de servicio. La instancia no utiliza una imagen soportada. Revise las imágenes soportadas. Cree una instancia con una imagen soportada. Imágenes e imágenes personalizadas antiguas: no existe software Oracle Cloud Agent en la instancia. Conéctese a la instancia y busque el software. Instale el software Oracle Cloud Agent. Hay algún otro problema con el software de Oracle Cloud Agent. (no aplicable) Siga los pasos de solución de problemas de Oracle Cloud Agent. Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.
- Abra el menú de navegación y haga clic en Observación y gestión. En Supervisión, haga clic en Métricas de servicio.
- Seleccionar un compartimento.
-
Para Espacio de nombre de métrica, seleccione oci_computeagent.
La página Métricas de servicio actualiza dinámicamente la página para mostrar gráficos para cada métrica emitida por el espacio de nombres de métrica seleccionado.
Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.
- Abra el menú de navegación y haga clic en Recursos informáticos. En Compute, haga clic en Grupos de instancias.
- Haga clic en el pool de instancias en el que está interesado.
- En Recursos, haga clic en Métricas.
-
En la lista Espacio de nombre de métrica, seleccione oci_computeagent.
En la página Métricas se muestra un conjunto de gráficos predeterminado del pool de instancias actual.
Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.
Uso de la API
Para obtener más información sobre el uso de la API y la firma de solicitudes, consulte la documentación de la API de REST y Credenciales de seguridad. Para obtener información sobre los SDK, consulte Los SDK y la CLI.
- API de supervisión para las métricas y alarmas
- API denotificaciones para notificaciones (se usa con alarmas)