Métricas de instancias informáticas

Puede supervisar el estado, la capacidad y el rendimiento de sus instancias informáticas utilizando métricas, alarmas y notificaciones.

En este tema se describen las métricas emitidas por el espacio de nombre de métrica oci_computeagent (el plugin Compute Instance Monitoring en las instancias informáticas).

Puede ver estas métricas para instancias informáticas individuales y para todas las instancias de un pool de instancias.

Recursos: instancias informáticas habilitadas para la supervisión.

Visión general de las métricas para una instancia y recursos relacionados

En esta sección se ofrece una visión general de los diferentes tipos de métricas disponibles para una instancia y sus dispositivos de almacenamiento y red. Consulte el siguiente diagrama y tabla para obtener un resumen.

En esta imagen se muestran los tipos de métricas disponibles para una instancia y componentes relacionados.

Espacio de nombre de métrica ID de recurso Ubicación de medición Métricas disponibles
oci_computeagent OCID de instancia En la instancia. Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn se agrega a todas las VNIC asociadas a la instancia.

Consulte Métricas disponibles: oci_computeagent.

oci_blockstore OCID de volumen de inicio o de bloque Por el servicio Volumen de bloque. Las métricas son para un volumen individual (volumen de inicio o volumen de bloque). Consulte Métricas de volumen de bloque.
oci_vcn VNIC OCID Por el servicio Redes. Las métricas son para una VNIC individual.

Consulte Métricas de VNIC.

Antes de empezar

  • Políticas de IAM: para supervisar los recursos, debe contar con el tipo necesario de acceso en una política escrita por un administrador, tanto si utiliza la consola como la API de REST con un SDK, CLI u otra herramienta. La política debe proporcionar acceso a los servicios de supervisión, así como a los recursos que se están supervisando. Si intenta realizar una acción y obtiene un mensaje que indica que no tiene permiso o que no está autorizado, póngase en contacto con el administrador para averiguar qué tipo de acceso se le ha otorgado y en qué compartimento debe trabajar. Para obtener más información sobre las autorizaciones de usuario para la supervisión, consulte Políticas de IAM.
  • Existen métricas en la supervisión: los recursos que desea supervisar deben emitir métricas al servicio de supervisión.
  • Instancias de Compute: para emitir métricas, el plugin de supervisión de instancias de Compute debe estar activado en la instancia y los plugins deben estar en ejecución. La instancia también debe tener un gateway de servicio o una dirección IP pública para enviar las métricas al servicio Monitoring. Para obtener más información, consulte Habilitación de supervisión de instancias de Compute.

Métricas disponibles: oci_computeagent

Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento de las instancias informáticas. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.

Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn se agrega a todas las VNIC asociadas a la instancia.

Para las métricas emitidas por el espacio de nombres de métrica oci_computeagent, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

Cada métrica incluye las siguientes dimensiones:

availabilityDomain
El dominio de disponibilidad  en el que reside la instancia.
faultDomain
El dominio de errores en el que reside la instancia.
imageId
La OCID de la imagen  para la instancia.
instancePoolId
El pool de instancias al que pertenece la instancia.
region
La región  en la que reside la instancia.
resourceDisplayName
Nombre fácil de recordar de la instancia.
resourceId
El OCID  de la instancia.
unidad
La unidad  de la instancia.
Métrica Nombre mostrado de la métrica Unidad Descripción Dimensiones
CpuUtilization Utilización de CPU porcentaje

Nivel de actividad de la CPU. Expresado como porcentaje del tiempo total.

Para pools de instancias, el valor se calcula entre todas las instancias del pool.

availabilityDomain

faultDomain

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

DiskBytesRead1, 3 Bytes de lectura de disco bytes Rendimiento de lectura. Se expresa como bytes leídos por intervalo.
DiskBytesWritten1, 3 Bytes de escritura de disco bytes Rendimiento de escritura. Se expresa como bytes escritos por intervalo.
DiskIopsRead1, 3 E/S de lectura de disco operaciones Nivel de actividad de lecturas de E/S. Se expresa como lecturas por intervalo.
DiskIopsWritten1, 3 E/S de escritura de disco operaciones Nivel de actividad de escrituras de E/S. Expresado como escrituras por intervalo.
LoadAverage Media de carga Número de procesos Carga media del sistema calculada en un período de 1 minuto.
MemoryAllocationStalls Paralizaciones de asignaciones de memoria número de paralizaciones Número de veces que se ha llamado directamente a una reclamación de página.
MemoryUtilization1 Uso de memoria porcentaje

Espacio actualmente en uso. Medido por páginas. Expresado como porcentaje de páginas utilizadas.

Para pools de instancias, el valor se calcula entre todas las instancias del pool.

NetworksBytesIn1, 2 Bytes de recepción de red bytes

Rendimiento de recepción de red. Expresado como bytes recibidos.

NetworksBytesOut1, 2 Bytes de transmisión de red bytes Rendimiento de transmisión de red. Expresado como bytes transmitidos.

1Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo.

2 El servicio Networking proporciona más métricas (en el espacio de nombres de métrica oci_vcn) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red.

3 El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica oci_blockstore) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Métricas disponibles: gpu_infrastructure_health

Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento global de las instancias. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.

Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn se agrega a todas las VNIC asociadas a la instancia.

Para las métricas emitidas por el espacio de nombres de métrica gpu_infrastructure_health, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

Cada métrica incluye las siguientes dimensiones:

componente
GPU o rdma_nic
registro de hora
Hora UTC en la que se emite la carga útil/latido
versión
Número de versión de carga útil para compatibilidad
Métrica Nombre mostrado de la métrica Unidad Descripción Dimensiones
GpuUtilization Utilización de GPU porcentaje

Nivel de actividad de la GPU. Expresado como porcentaje del tiempo total.

Para pools de instancias, el valor se calcula entre todas las instancias del pool.

availabilityDomain

faultDomain

gpuId

imageId

instancePoolId

region

resourceDisplayName

resourceId

shape

GpuMemoryUtilization Uso de memoria de GPU porcentaje Porcentaje del recurso de memoria de GPU en uso.
GpuPowerDraw Consumo de energía de GPU entero Cantidad de energía de GPU utilizada.
GpuTemperature Temperatura de GPU entero La temperatura de la GPU informada.
GpuEccSingleBitErrors Errores de un bit de GPU entero Número de errores de ECC de un solo bit de GPU informados.
GpuEccDoubleBitErrors Errores de dos bits de GPU entero Número de errores de ECC de doble bit de GPU informados.

1Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo.

2 El servicio Networking proporciona más métricas (en el espacio de nombres de métrica oci_vcn) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red.

3 El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica oci_blockstore) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Métricas disponibles: rdma_infrastructure_health

Las métricas de instancia informática ayudan a medir el nivel de actividad y el rendimiento de las instancias informáticas. Las métricas que se muestran en la siguiente tabla están disponibles para cualquier instancia informática activada para supervisión. Para obtener estas métricas, active la supervisión en la instancia.

Las métricas de este espacio de nombres se agregan a todos los recursos relacionados de la instancia. Por ejemplo, DiskBytesRead se agrega a todos los volúmenes de almacenamiento asociados de la instancia y NetworkBytesIn se agrega a todas las VNIC asociadas a la instancia.

Para las métricas emitidas por el espacio de nombres de métrica rdma_infrastructure_health, los puntos de datos se muestrean cada diez segundos. Se emite un lote de seis puntos de datos cada minuto. Por lo tanto, para cada granularidad de minuto, el recuento agregado es siempre seis, la suma agregada es la suma de los seis puntos de datos y la media agregada es la media de los seis puntos de datos.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

Cada métrica incluye las siguientes dimensiones:

componente
GPU o rdma_nic
registro de hora
Hora UTC en la que se emite la carga útil/latido
versión
Número de versión de carga útil para compatibilidad
Métrica Nombre mostrado de la métrica Unidad Descripción Dimensiones
RdmaTxBytes bytes de transmisión de red agregados de RDMA bytes bytes transmitidos en la interfaz de RDMA.

availabilityDomain

faultDomain

imageId

instancePoolId

rdmaId

region

resourceDisplayName

resourceId

shape

RdmaRxBytes bytes de recepción de red agregados de RDMA bytes bytes recibidos en la interfaz de RDMA.
RdmaTxPackets Paquetes de transmisión de red agregados de RDMA entero Número de paquetes transmitidos en la interfaz de RDMA.
RdmaRxPackets Paquetes de recepción de red agregada de RDMA entero Número de paquetes recibidos en la interfaz de RDMA.

1Esta métrica es un contador acumulativo que muestra un comportamiento monotónicamente creciente para cada sesión del software del agente de Oracle Cloud, que se restablece cuando se reinicia el sistema operativo.

2 El servicio Networking proporciona más métricas (en el espacio de nombres de métrica oci_vcn) para cada VNIC de la instancia. Para obtener más información, consulte Métricas de red.

3 El servicio Block Volume proporciona más métricas (en el espacio de nombres de métrica oci_blockstore) para cada volumen asociado a la instancia. Para obtener más información, consulte Métricas del volumen de bloque.

Uso de la Consola

Para ver los gráficos de métricas por defecto para una única instancia informática
  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
  2. Haga clic en la instancia en la que está interesado.
  3. En Recursos, haga clic en Métricas.
  4. En la lista Espacio de nombre de métrica, seleccione oci_computeagent.

    En la página Métricas se muestra un conjunto predeterminado de gráficos para la instancia actual.

    ¿No ve ningún gráfico de métricas para la instancia?

    Si no ve ningún gráfico de métricas, es posible que la instancia no emita métricas. Consulte las siguientes causas y resoluciones posibles.

    Causa posible Cómo comprobarlo Solución
    El plugin Compute Instance Monitoring está desactivado en la instancia o los plugins se han parado. Revise las propiedades de la instancia. Active el plugin de Compute Instance Monitoring e inicie todos los plugins.
    La instancia no puede acceder al servicio de supervisión porque su VCN no utiliza Internet. Revise la dirección IP de la instancia. Si no es pública, se necesita una puerta de enlace de servicio. Configure una puerta de enlace de servicio.
    La instancia no utiliza una imagen soportada. Revise las imágenes soportadas. Cree una instancia con una imagen soportada.
    Imágenes e imágenes personalizadas antiguas: no existe software Oracle Cloud Agent en la instancia. Conéctese a la instancia y busque el software. Instale el software Oracle Cloud Agent.
    Hay algún otro problema con el software de Oracle Cloud Agent. (no aplicable) Siga los pasos de solución de problemas de Oracle Cloud Agent.

    Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.

Para ver los gráficos de métricas por defecto para todas las instancias informáticas en un compartimento
  1. Abra el menú de navegación y haga clic en Observación y gestión. En Supervisión, haga clic en Métricas de servicio.
  2. Seleccionar un compartimento.
  3. Para Espacio de nombre de métrica, seleccione oci_computeagent.

    La página Métricas de servicio actualiza dinámicamente la página para mostrar gráficos para cada métrica emitida por el espacio de nombres de métrica seleccionado.

Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.

Ver gráficos de métricas por defecto para las instancias de un pool de instancias
  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Compute, haga clic en Grupos de instancias.
  2. Haga clic en el pool de instancias en el que está interesado.
  3. En Recursos, haga clic en Métricas.
  4. En la lista Espacio de nombre de métrica, seleccione oci_computeagent.

    En la página Métricas se muestra un conjunto de gráficos predeterminado del pool de instancias actual.

Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.