Métricas de instancias informáticas

Puede supervisar el estado, la capacidad y el rendimiento de sus instancias informáticas utilizando métricas, alarmas y notificaciones.

En este tema se describen las métricas emitidas por el espacio de nombre de métrica oci_computeagent (el plugin Compute Instance Monitoring en las instancias informáticas).

Puede ver estas métricas para instancias informáticas individuales y para todas las instancias de un pool de instancias.

Recursos: instancias informáticas habilitadas para la supervisión.

Visión general de las métricas para una instancia y recursos relacionados

En esta sección se ofrece una visión general de los diferentes tipos de métricas disponibles para una instancia y sus dispositivos de almacenamiento y red. Consulte el siguiente diagrama y tabla para obtener un resumen.

En esta imagen se muestran los tipos de métricas disponibles para una instancia y componentes relacionados.


Espacio de nombre de métrica	ID de recurso	Ubicación de medición	Métricas disponibles
`oci_computeagent`	OCID de instancia	En la instancia. Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, `DiskBytesRead` se agrega a todos los volúmenes de almacenamiento asociados de la instancia y `NetworkBytesIn` se agrega a todas las VNIC asociadas a la instancia.	Consulte Métricas disponibles: oci_computeagent.
`oci_blockstore`	OCID de volumen de inicio o de bloque	Por el servicio Volumen de bloque. Las métricas son para un volumen individual (volumen de inicio o volumen de bloque).	Consulte Métricas de volumen de bloque.
`oci_vcn`	VNIC OCID	Por el servicio Redes. Las métricas son para una VNIC individual.	Consulte Métricas de VNIC.

Antes de empezar

Políticas de IAM: para supervisar recursos, se le debe otorgar el tipo necesario de acceso en una política escrita por un administrador, tanto si utiliza la consola como la API de REST con un SDK, una CLI u otra herramienta. La política debe proporcionar acceso tanto a los servicios de supervisión como a los recursos que se están supervisando. Si intenta realizar una acción y obtiene un mensaje que indique que no tiene permiso o no está autorizado, póngase en contacto con el administrador para averiguar qué tipo de acceso se le otorgó y en qué compartimento se debe trabajar. Para obtener más información sobre la autorización de usuario para la supervisión, consulte Políticas de IAM.
Existen métricas en la supervisión: los recursos que desea supervisar deben emitir métricas al servicio de supervisión.
Instancias de Compute: para emitir métricas, el plugin de supervisión de instancias de Compute debe estar activado en la instancia y los plugins deben estar en ejecución. La instancia también debe tener un gateway de servicio o una dirección IP pública para enviar las métricas al servicio Monitoring. Para obtener más información, consulte Habilitación de supervisión de instancias de Compute.

Métricas disponibles: oci_computeagent

Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento de las instancias informáticas. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.

Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn se agrega a todas las VNIC asociadas a la instancia.

Para las métricas emitidas por el espacio de nombres de métrica oci_computeagent, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

Cada métrica incluye las siguientes dimensiones:

availabilityDomain: El dominio de disponibilidad en el que reside la instancia.
faultDomain: El dominio de errores en el que reside la instancia.
imageId: La OCID de la imagen para la instancia.
instancePoolId: El pool de instancias al que pertenece la instancia.
region: La región en la que reside la instancia.
resourceDisplayName: Nombre fácil de recordar de la instancia.
resourceId: El OCID de la instancia.
unidad: La unidad de la instancia.


Métrica	Nombre mostrado de la métrica	Unidad	Descripción	Dimensiones
`CpuUtilization`	Utilización de CPU	porcentaje	Nivel de actividad de la CPU. Expresado como porcentaje del tiempo total. Para pools de instancias, el valor se calcula entre todas las instancias del pool.	`availabilityDomain` `faultDomain` `imageId` `instancePoolId` `region` `resourceDisplayName` `resourceId` `shape`
`DiskBytesRead`^1, ³	Bytes de lectura de disco	bytes	Rendimiento de lectura. Se expresa como bytes leídos por intervalo.
`DiskBytesWritten`^1, ³	Bytes de escritura de disco	bytes	Rendimiento de escritura. Se expresa como bytes escritos por intervalo.
`DiskIopsRead`^1, ³	E/S de lectura de disco	operaciones	Nivel de actividad de lecturas de E/S. Se expresa como lecturas por intervalo.
`DiskIopsWritten`^1, ³	E/S de escritura de disco	operaciones	Nivel de actividad de escrituras de E/S. Expresado como escrituras por intervalo.
`LoadAverage`	Media de carga	Número de procesos	Carga media del sistema calculada en un período de 1 minuto.
`MemoryAllocationStalls`	Paralizaciones de asignaciones de memoria	número de paralizaciones	Número de veces que se ha llamado directamente a una reclamación de página.
`MemoryUtilization`¹	Uso de memoria	porcentaje	Espacio actualmente en uso. Medido por páginas. Expresado como porcentaje de páginas utilizadas. Para pools de instancias, el valor se calcula entre todas las instancias del pool.
`NetworksBytesIn`^1, ²	Bytes de recepción de red	bytes	Rendimiento de recepción de red. Expresado como bytes recibidos.
`NetworksBytesOut`^1, ²	Bytes de transmisión de red	bytes	Rendimiento de transmisión de red. Expresado como bytes transmitidos.
¹Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. ² El servicio Networking proporciona más métricas (en el espacio de nombres de métrica `oci_vcn`) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red. ³ El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica `oci_blockstore`) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Métricas disponibles: gpu_infrastructure_health

Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento global de las instancias. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.

Para las métricas emitidas por el espacio de nombres de métrica gpu_infrastructure_health, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

Cada métrica incluye las siguientes dimensiones:

componente: GPU o rdma_nic
registro de hora: Hora UTC en la que se emite la carga útil/latido
versión: Número de versión de carga útil para compatibilidad


Métrica	Nombre mostrado de la métrica	Unidad	Descripción	Dimensiones
`GpuUtilization`	Utilización de GPU	porcentaje	Nivel de actividad de la GPU. Expresado como porcentaje del tiempo total. Para pools de instancias, el valor se calcula entre todas las instancias del pool.	`availabilityDomain` `faultDomain` `gpuId` `imageId` `instancePoolId` `region` `resourceDisplayName` `resourceId` `shape`
`GpuMemoryUtilization`	Uso de memoria de GPU	porcentaje	Porcentaje del recurso de memoria de GPU en uso.
`GpuPowerDraw`	Consumo de energía de GPU	entero	Cantidad de energía de GPU utilizada.
`GpuTemperature`	Temperatura de GPU	entero	La temperatura de la GPU informada.
`GpuEccSingleBitErrors`	Errores de un bit de GPU	entero	Número de errores de ECC de un solo bit de GPU informados.
`GpuEccDoubleBitErrors`	Errores de dos bits de GPU	entero	Número de errores de ECC de doble bit de GPU informados.
¹Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. ² El servicio Networking proporciona más métricas (en el espacio de nombres de métrica `oci_vcn`) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red. ³ El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica `oci_blockstore`) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Métricas de fallo: gpu_infrastructure_health


Métrica	Nombre mostrado de la métrica	Unidad	Descripción	Dimensiones
`Fault`	Fallo de GPU	número	Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.	`availabilityDomain` `faultCode` `faultDomain` `gpuId` `imageId` `instancePoolId` `pcieAddress` `region` `resourceDisplayName` `resourceId` `shape`
¹Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. ² El servicio Networking proporciona más métricas (en el espacio de nombres de métrica `oci_vcn`) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red. ³ El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica `oci_blockstore`) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Métricas disponibles: rdma_infrastructure_health

Para las métricas emitidas por el espacio de nombres de métrica rdma_infrastructure_health, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

Cada métrica incluye las siguientes dimensiones:

componente: GPU o rdma_nic
registro de hora: Hora UTC en la que se emite la carga útil/latido
versión: Número de versión de carga útil para compatibilidad


Métrica	Nombre mostrado de la métrica	Unidad	Descripción	Dimensiones
`RdmaTxBytes`	bytes de transmisión de red agregados de RDMA	bytes	bytes transmitidos en la interfaz de RDMA.	`availabilityDomain` `faultDomain` `imageId` `instancePoolId` `rdmaId` `region` `resourceDisplayName` `resourceId` `shape`
`RdmaRxBytes`	bytes de recepción de red agregados de RDMA	bytes	bytes recibidos en la interfaz de RDMA.
`RdmaTxPackets`	Paquetes de transmisión de red agregados de RDMA	entero	Número de paquetes transmitidos en la interfaz de RDMA.
`RdmaRxPackets`	Paquetes de recepción de red agregada de RDMA	entero	Número de paquetes recibidos en la interfaz de RDMA.
¹Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. ² El servicio Networking proporciona más métricas (en el espacio de nombres de métrica `oci_vcn`) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red. ³ El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica `oci_blockstore`) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Métricas de fallo: rdma_infrastructure_health


Métrica	Nombre mostrado de la métrica	Unidad	Descripción	Dimensiones
`RdmaLinkSpeedFault`	Faults	número	Detecta si hay un fallo de velocidad de enlace presente. Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.	`availabilityDomain` `faultDomain` `imageId` `instancePoolId` `pcieAddress` `rdmaId` `region` `resourceDisplayName` `resourceId` `shape`
`RdmaPcieAddressFault`	Faults	número	Detecta si hay un fallo en la dirección PCIE. Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.
`RdmaPcieBerCheckFault`	Faults	número	Detecta si hay un fallo de PCIE BER. Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.
`RdmaPcieCableFlapFault`	Faults	número	Detecta si hay un fallo de solapa de cable PCIE. Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.
`RdmaPcieCablePlugFault`	Faults	número	Detecta si hay un fallo de conexión de cable PCIE. Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.
`RdmaPcieCableStateFault`	Faults	número	Detecta si hay un fallo de estado del cable PCIE. Si el valor es 0, no hay fallos. Si el valor es 1, se detectan fallos.
¹Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo. ² El servicio Networking proporciona más métricas (en el espacio de nombres de métrica `oci_vcn`) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red. ³ El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica `oci_blockstore`) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Uso de la consola

Para ver los gráficos de métricas por defecto para una única instancia informática

Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Instancias.
Haga clic en la instancia en la que está interesado.
En Recursos, haga clic en Métricas.

En la lista Espacio de nombre de métrica, seleccione oci_computeagent.

En la página Métricas se muestra un conjunto predeterminado de gráficos para la instancia actual.

¿No ve ningún gráfico de métricas para la instancia?

Si no ve ningún gráfico de métricas, es posible que la instancia no emita métricas. Consulte las siguientes causas y resoluciones posibles.


Causa posible	Cómo comprobarlo	Solución
El plugin Compute Instance Monitoring está desactivado en la instancia o los plugins se han parado.	Revise las propiedades de la instancia.	Active el plugin de Compute Instance Monitoring e inicie todos los plugins.
La instancia no puede acceder al servicio Monitoring porque su VCN no utiliza Internet.	Revise la dirección IP de la instancia. Si no es pública, se necesita una puerta de enlace de servicio.	Configure una puerta de enlace de servicio.
La instancia no utiliza una imagen soportada.	Revise las imágenes soportadas.	Cree una instancia con una imagen soportada.
Imágenes e imágenes personalizadas antiguas: no existe software Oracle Cloud Agent en la instancia.	Conéctese a la instancia y busque el software.	Instale el software Oracle Cloud Agent.
Hay algún otro problema con el software de Oracle Cloud Agent.	(no aplicable)	Siga los pasos de solución de problemas de Oracle Cloud Agent.

Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.

Para ver los gráficos de métricas por defecto para los recursos relacionados con una instancia informática

Para un volumen en bloque asociado: al visualizar los detalles de la instancia, en Recursos, haga clic en Volúmenes en bloque asociados y, a continuación, en el volumen que le interesa. En Recursos, haga clic en Métricas para ver los gráficos del volumen. Para obtener más información sobre las métricas emitidas, consulte Métricas de volumen de bloque.
Para el volumen de inicio asociado: al visualizar los detalles de la instancia, en Recursos, haga clic en Volumen de inicio y, a continuación, haga clic en el volumen que le interesa. En Recursos, haga clic en Métricas para ver los gráficos del volumen. Para obtener más información sobre las métricas emitidas, consulte Métricas de volumen de bloque.
Para una VNIC asociada: al visualizar los detalles de la instancia, en Recursos, haga clic en VNIC asociadas y, a continuación, en la VNIC que le interesa. En Recursos, haga clic en Métricas para ver los gráficos de la VNIC. Para obtener más información sobre las métricas emitidas, consulte Métricas de red.

Para ver los gráficos de métricas por defecto para todas las instancias informáticas en un compartimento

Abra el menú de navegación y seleccione Observación y gestión. En Supervisión, seleccione Métricas de servicio.
Seleccionar un compartimento.
Para Espacio de nombre de métrica, seleccione oci_computeagent.

La página Métricas de servicio actualiza dinámicamente la página para mostrar gráficos para cada métrica emitida por el espacio de nombres de métrica seleccionado.

Ver gráficos de métricas por defecto para las instancias de un pool de instancias

Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Pools de instancias.
Haga clic en el pool de instancias en el que está interesado.
En Recursos, haga clic en Métricas.
En la lista Espacio de nombre de métrica, seleccione oci_computeagent.

En la página Métricas se muestra un conjunto de gráficos predeterminado del pool de instancias actual.

Uso de la API

Para obtener más información sobre el uso de la API y la firma de solicitudes, consulte la documentación de la API de REST y Credenciales de seguridad. Para obtener información sobre los SDK, consulte Los SDK y la CLI.

Utilice las siguientes API para la supervisión:

API de supervisión para las métricas y alarmas
API denotificaciones para notificaciones (se usa con alarmas)

Documentación de Oracle Cloud Infrastructure

Métricas de instancias informáticas

Visión general de las métricas para una instancia y recursos relacionados

Antes de empezar

Métricas disponibles: oci_computeagent

Métricas disponibles: gpu_infrastructure_health

Métricas de fallo: gpu_infrastructure_health

Métricas disponibles: rdma_infrastructure_health

Métricas de fallo: rdma_infrastructure_health

Uso de la consola

Uso de la API