Métricas de estado de infraestructura

Puede supervisar el estado, la capacidad y el rendimiento de la infraestructura para sus instancias informáticas de máquina virtual (VM) y con hardware dedicado mediante métricas, alarmas, y notificaciones.

En este tema se describen las métricas emitidas por el espacio de nombres de la métrica oci_compute_infrastructure_health.

Recursos: instancias informáticas.

Descripción general de métricas: oci_compute_infrastructure_health

Las métricas de estado de la infraestructura informática le ayudan a supervisar el estado de las instancias informáticas.

  • Instance health (up/down) status: The instance_status metric lets you check whether a VM instance is available (up) or unavailable (down) when in the running state. Si la instancia sigue sin estar disponible a los 30 minutos, póngase en contacto con los Servicios de Soporte.
  • Estado de mantenimiento de la instancia: la métrica maintenance_status permite supervisar si se ha programado el mantenimiento planificado de la infraestructura de una instancia de máquina virtual o con hardware dedicado.
  • Estado de la infraestructura de hardware dedicado: la métrica health_status le ayuda a supervisar el estado de la infraestructura para las instancias con hardware dedicado, incluidos componentes de hardware como la CPU y la memoria.

En función del valor de las métricas, puede mover las instancias afectadas al hardware en buen estado de forma proactiva y, por lo tanto, minimizar el impacto en las aplicaciones.

Política de IAM necesaria

Para supervisar los recursos, debe contar con el tipo necesario de acceso en una política escrita por un administrador, tanto si utiliza la consola como la API de REST con un SDK, CLI u otra herramienta. La política debe proporcionar acceso a los servicios de supervisión, así como a los recursos que se están supervisando. Si intenta realizar una acción y obtiene un mensaje que indica que no tiene permiso o que no está autorizado, póngase en contacto con el administrador para averiguar qué tipo de acceso se le ha otorgado y en qué compartimento debe trabajar. Para obtener más información sobre las autorizaciones de usuario para la supervisión, consulte Políticas de IAM.

Métricas disponibles: oci_compute_infrastructure_health

Las métricas que aparecen en la siguiente tabla están disponibles automáticamente para sus instancias. No necesita activar la supervisión en la instancia para obtener estas métricas.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

En función de la métrica, están disponibles las siguientes dimensiones:

faultClass

Tipo de incidencia de hardware:

  • CPU: se ha detectado un fallo en una o más CPU.
  • MEM-BOOT: se ha detectado un fallo en el subsistema de memoria durante el inicio de la instancia o un reinicio reciente.
  • MEM-RUNTIME: se ha detectado un fallo en el subsistema de memoria.
  • MGMT-CONTROLLER: se ha detectado un fallo en el controlador de gestión de instancias.
  • PCI: se ha detectado un fallo en el subsistema de la PCI.
  • PCI-NIC: se ha detectado un error en la tarjeta de interfaz de red (NIC) de la instancia.

    Importante

    La clase de fallo PCI-NIC está en desuso. Debe migrar a la clase de fallo PCI para obtener una funcionalidad similar.
  • SDN-INTERFACE: se ha detectado un error en la interfaz de red definida por software de la instancia.

Para obtener sugerencias de solución de problemas y más información sobre estos problemas de hardware, consulte Supervisión de estado de recursos informáticos para instancias con hardware dedicado.

resourceDisplayName
Nombre fácil de recordar de la instancia.
resourceId
El OCID  de la instancia.
maintenanceDueTime

Hora de inicio programada de la ventana de mantenimiento de 24 horas, con el formato definido por RFC3339.

computeMaintenanceAction

Acción que Oracle Cloud Infrastructure realizará en una instancia durante un evento de mantenimiento programado:

  • REBOOT: la instancia se migra desde el host físico que necesita mantenimiento a un host en buen estado. Si la migración activa no es posible, la instancia se migra con reinicio.
  • REBUILD_IN_PLACE: la instancia se para, se reconstruye en el mismo hardware físico y se reinicia. Durante el proceso de mantenimiento, se produce un tiempo de inactividad de varias horas.
recommendedAction

Acción que puede realizar antes del evento de mantenimiento programado, para que pueda controlar cómo y cuándo las aplicaciones experimentan tiempo de inactividad.

Métrica Nombre mostrado de la métrica Unidad Descripción Dimensiones
health_status Estado de la infraestructura Incidencias

Número de problemas de estado para una instancia. Cualquier valor distinto de cero indica un defecto de estado.

Esta métrica solo está disponible para las instancias con hardware dedicado.

faultClass

resourceDisplayName

resourceId

instance_status Estado de la Instancia Recuento

Estado de una instancia en ejecución. Un valor de 0 indica que la instancia está disponible (activa). Un valor de 1 indica que la instancia no está disponible (inactiva) debido a un problema de la infraestructura. Si la instancia se para, la métrica no tiene ningún valor.

Esta métrica solo está disponible para instancias de máquina virtual.

resourceDisplayName

resourceId

maintenance_status Estado de mantenimiento Recuento

Estado de mantenimiento de una instancia. Un valor de 0 indica que la instancia no está programada para un evento de mantenimiento de infraestructura. Un valor de 1 indica que la instancia está programada para un evento de mantenimiento de infraestructura.

Esta métrica está disponible para las instancias de máquina virtual y las instancias con hardware dedicado.

maintenanceDueTime

computeMaintenanceAction

recommendedAction

resourceDisplayName

resourceId

Uso de la Consola

Para ver métricas de estado de la infraestructura para una única instancia informática
  1. Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
  2. Haga clic en la instancia en la que está interesado.
  3. En Recursos, haga clic en Métricas.
  4. En la lista Espacio de nombre de métrica, seleccione oci_compute_infrastructure_health.

    En la página Métricas se muestra un conjunto predeterminado de gráficos para la instancia actual.

Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.

Para ver métricas de estado de infraestructura de todas las instancias informáticas en un compartimento
  1. Abra el menú de navegación y haga clic en Observación y gestión. En Supervisión, haga clic en Métricas de servicio.
  2. Seleccionar un compartimento.
  3. Para Espacio de nombre de métrica, seleccione oci_compute_infrastructure_health.

    La página Métricas de servicio se actualiza dinámicamente para mostrar gráficos para cada métrica emitida por el espacio de nombres de métrica seleccionado.

Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.