Métricas de estado de infraestructura

Puede supervisar el estado, la capacidad y el rendimiento de la infraestructura para sus instancias informáticas de máquina virtual (VM) y con hardware dedicado mediante métricas, alarmas, y notificaciones.

En este tema se describen las métricas emitidas por el espacio de nombres de la métrica oci_compute_infrastructure_health.

Recursos: instancias de Compute.

Descripción general de métricas: oci_compute_infrastructure_health

Las métricas de estado de la infraestructura informática le ayudan a supervisar el estado de las instancias informáticas.

Estado de las instancias (activo/inactivo): la métrica instance_status permite comprobar si una instancia de VM está disponible (activo) o no (inactivo) cuando se encuentra en el estado En ejecución. Si la instancia sigue sin estar disponible a los 30 minutos, póngase en contacto con los Servicios de Soporte.
Estado de mantenimiento de instancia: la métrica maintenance_status permite supervisar si se han programado instancias de máquina virtual o con hardware dedicado para mantenimiento planificado de la infraestructura.
Estado de Infraestructura de Hardware dedicado: la métrica health_status le ayuda a supervisar el estado de infraestructura para instancias con hardware dedicadas, incluidos componentes del hardware como la CPU y memoria.

En función del valor de las métricas, puede mover las instancias afectadas al hardware en buen estado de forma proactiva y, por lo tanto, minimizar el impacto en las aplicaciones.

Política de IAM necesaria

Para supervisar recursos, se le debe otorgar el tipo necesario de acceso en una política escrita por un administrador, tanto si utiliza la consola como la API de REST con un SDK, la CLI u otra herramienta. La política debe proporcionarle acceso tanto a los servicios de supervisión como a los recursos que se están supervisando. Si intenta realizar una acción y obtiene un mensaje que indique que no tiene permiso o no está autorizado, póngase en contacto con el administrador para averiguar qué tipo de acceso se le otorgó y en qué compartimento se debe trabajar. Para obtener más información sobre la autorización de usuario para la supervisión, consulte Políticas de IAM.

Métricas disponibles: oci_compute_infrastructure_health

Las métricas que aparecen en la siguiente tabla están disponibles automáticamente para sus instancias. No necesita activar la supervisión en la instancia para obtener estas métricas.

También puede utilizar el servicio Supervisión para crear consultas personalizadas.

En función de la métrica, están disponibles las siguientes dimensiones:

faultClass

Tipo de incidencia de hardware:

CPU: se ha detectado un fallo en una o más CPU.
MEM-BOOT: se ha detectado un fallo en el subsistema de memoria durante el inicio de la instancia o un reinicio reciente.
MEM-RUNTIME: se ha detectado un fallo en el subsistema de memoria.
MGMT-CONTROLLER: se ha detectado un fallo en el controlador de gestión de instancias.
PCI: se ha detectado un fallo en el subsistema de la PCI.
PCI-NIC: se ha detectado un error en la tarjeta de interfaz de red (NIC) de la instancia.

Importante

La clase de fallo PCI-NIC está en desuso. Debe migrar a la clase de fallo PCI para obtener una funcionalidad similar.
SDN-INTERFACE: se ha detectado un error en la interfaz de red definida por software de la instancia.

Para obtener sugerencias de solución de problemas y más información sobre estos problemas de hardware, consulte Supervisión de estado de recursos informáticos para instancias con hardware dedicado.

resourceDisplayName

Nombre fácil de recordar de la instancia.

resourceId

El OCID de la instancia.

maintenanceDueTime

Hora de inicio programada de la ventana de mantenimiento de 24 horas, con el formato definido por RFC3339.

computeMaintenanceAction

Acción que Oracle Cloud Infrastructure realizará en una instancia durante un evento de mantenimiento programado:

REBOOT: la instancia se migra desde el host físico que necesita mantenimiento a un host en buen estado. Si la migración activa no es posible, la instancia se migra con reinicio.
REBUILD_IN_PLACE: la instancia se para, se reconstruye en el mismo hardware físico y se reinicia. Durante el proceso de mantenimiento, se produce un tiempo de inactividad de varias horas.

recommendedAction

Acción que puede realizar antes del evento de mantenimiento programado, para que pueda controlar cómo y cuándo las aplicaciones experimentan tiempo de inactividad.

REBOOT: puede reiniciar la instancia de forma proactiva antes de la hora de mantenimiento programada. Al migrar con reinicio una instancia para tareas de mantenimiento, la instancia se para en el host físico que necesita mantenimiento y, a continuación, se reinicia en un host en buen estado.


Métrica	Nombre mostrado de la métrica	Unidad	Descripción	Dimensiones
`health_status`	Estado de la infraestructura	Incidencias	Número de problemas de salud de una instancia. Cualquier valor distinto de cero indica un defecto de estado. Esta métrica solo está disponible para las instancias con hardware dedicado.	`faultClass` `resourceDisplayName` `resourceId`
`instance_status`	Estado de la Instancia	Recuento	Estado de una instancia en ejecución. Un valor de 0 indica que la instancia está disponible (activa). Un valor de 1 indica que la instancia no está disponible (inactiva) debido a un problema de la infraestructura. Si la instancia se para, la métrica no tiene ningún valor. Esta métrica solo está disponible para instancias de VM.	`resourceDisplayName` `resourceId`
`maintenance_status`	Estado de Mantenimiento	Recuento	Estado de mantenimiento de una instancia. Un valor de 0 indica que la instancia no está programada para un evento de mantenimiento de infraestructura. Un valor de 1 indica que la instancia está programada para un evento de mantenimiento de infraestructura. Esta métrica está disponible para las instancias de máquina virtual y las instancias con hardware dedicado.	`maintenanceDueTime` `computeMaintenanceAction` `recommendedAction` `resourceDisplayName` `resourceId`

Uso de la consola

Para ver métricas de estado de la infraestructura para una única instancia informática

Abra el menú de navegación y seleccione Recursos informáticos. En Recursos informáticos, seleccione Instancias.
Haga clic en la instancia en la que está interesado.
En Recursos, haga clic en Métricas.
En la lista Espacio de nombres de métrica, seleccione oci_compute_infrastructure_health.

En la página Métricas se muestra un conjunto predeterminado de gráficos para la instancia actual.

Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.

Para ver métricas de estado de infraestructura de todas las instancias informáticas en un compartimento

Abra el menú de navegación y seleccione Observación y gestión. En Supervisión, seleccione Métricas de servicio.
Seleccionar un compartimento.
Para Espacio de nombres de métrica, seleccione oci_compute_infrastructure_health.

La página Métricas de servicio se actualiza dinámicamente para mostrar gráficos para cada métrica emitida por el espacio de nombres de métrica seleccionado.

Uso de la API

Para obtener información sobre el uso de la API y las solicitudes de firma, consulte la documentación de la API de REST y las Credenciales de seguridad. Para obtener información sobre los SDK, consulte Los SDK y la CLI.

Utilice las siguientes API para la supervisión:

API de supervisión para las métricas y alarmas
La API de Notifications para las notificaciones (utilizadas con alarmas)