Métricas de estado de infraestructura
Puede supervisar el estado, la capacidad y el rendimiento de la infraestructura para sus instancias informáticas de máquina virtual (VM) y con hardware dedicado mediante métricas, alarmas, y notificaciones.
En este tema se describen las métricas emitidas por el espacio de nombres de la métrica oci_compute_infrastructure_health
.
Recursos: instancias informáticas.
Descripción general de métricas: oci_compute_infrastructure_health
Las métricas de estado de la infraestructura informática le ayudan a supervisar el estado de las instancias informáticas.
- Instance health (up/down) status: The
instance_status
metric lets you check whether a VM instance is available (up) or unavailable (down) when in the running state. Si la instancia sigue sin estar disponible a los 30 minutos, póngase en contacto con los Servicios de Soporte. - Estado de mantenimiento de la instancia: la métrica
maintenance_status
permite supervisar si se ha programado el mantenimiento planificado de la infraestructura de una instancia de máquina virtual o con hardware dedicado. - Estado de la infraestructura de hardware dedicado: la métrica
health_status
le ayuda a supervisar el estado de la infraestructura para las instancias con hardware dedicado, incluidos componentes de hardware como la CPU y la memoria.
En función del valor de las métricas, puede mover las instancias afectadas al hardware en buen estado de forma proactiva y, por lo tanto, minimizar el impacto en las aplicaciones.
Política de IAM necesaria
Para supervisar los recursos, debe contar con el tipo necesario de acceso en una política escrita por un administrador, tanto si utiliza la consola como la API de REST con un SDK, CLI u otra herramienta. La política debe proporcionar acceso a los servicios de supervisión, así como a los recursos que se están supervisando. Si intenta realizar una acción y obtiene un mensaje que indica que no tiene permiso o que no está autorizado, póngase en contacto con el administrador para averiguar qué tipo de acceso se le ha otorgado y en qué compartimento debe trabajar. Para obtener más información sobre las autorizaciones de usuario para la supervisión, consulte Políticas de IAM.
Métricas disponibles: oci_compute_infrastructure_health
Las métricas que aparecen en la siguiente tabla están disponibles automáticamente para sus instancias. No necesita activar la supervisión en la instancia para obtener estas métricas.
También puede utilizar el servicio Supervisión para crear consultas personalizadas.
En función de la métrica, están disponibles las siguientes dimensiones:
- faultClass
-
Tipo de incidencia de hardware:
CPU
: se ha detectado un fallo en una o más CPU.MEM-BOOT
: se ha detectado un fallo en el subsistema de memoria durante el inicio de la instancia o un reinicio reciente.MEM-RUNTIME
: se ha detectado un fallo en el subsistema de memoria.MGMT-CONTROLLER
: se ha detectado un fallo en el controlador de gestión de instancias.PCI
: se ha detectado un fallo en el subsistema de la PCI.-
PCI-NIC
: se ha detectado un error en la tarjeta de interfaz de red (NIC) de la instancia.Importante
La clase de falloPCI-NIC
está en desuso. Debe migrar a la clase de falloPCI
para obtener una funcionalidad similar. SDN-INTERFACE
: se ha detectado un error en la interfaz de red definida por software de la instancia.
- resourceDisplayName
- Nombre fácil de recordar de la instancia.
- resourceId
- El OCID de la instancia.
- maintenanceDueTime
-
Hora de inicio programada de la ventana de mantenimiento de 24 horas, con el formato definido por RFC3339.
- computeMaintenanceAction
-
Acción que Oracle Cloud Infrastructure realizará en una instancia durante un evento de mantenimiento programado:
REBOOT
: la instancia se migra desde el host físico que necesita mantenimiento a un host en buen estado. Si la migración activa no es posible, la instancia se migra con reinicio.REBUILD_IN_PLACE
: la instancia se para, se reconstruye en el mismo hardware físico y se reinicia. Durante el proceso de mantenimiento, se produce un tiempo de inactividad de varias horas.
- recommendedAction
-
Acción que puede realizar antes del evento de mantenimiento programado, para que pueda controlar cómo y cuándo las aplicaciones experimentan tiempo de inactividad.
REBOOT
: puede reiniciar la instancia de forma proactiva antes de la hora de mantenimiento programada. Al migrar con reinicio una instancia para tareas de mantenimiento, la instancia se para en el host físico que necesita mantenimiento y, a continuación, se reinicia en un host en buen estado.
Métrica | Nombre mostrado de la métrica | Unidad | Descripción | Dimensiones |
---|---|---|---|---|
health_status
|
Estado de la infraestructura | Incidencias |
Número de problemas de estado para una instancia. Cualquier valor distinto de cero indica un defecto de estado. Esta métrica solo está disponible para las instancias con hardware dedicado. |
|
instance_status
|
Estado de la Instancia | Recuento |
Estado de una instancia en ejecución. Un valor de 0 indica que la instancia está disponible (activa). Un valor de 1 indica que la instancia no está disponible (inactiva) debido a un problema de la infraestructura. Si la instancia se para, la métrica no tiene ningún valor. Esta métrica solo está disponible para instancias de máquina virtual. |
|
maintenance_status |
Estado de mantenimiento | Recuento |
Estado de mantenimiento de una instancia. Un valor de 0 indica que la instancia no está programada para un evento de mantenimiento de infraestructura. Un valor de 1 indica que la instancia está programada para un evento de mantenimiento de infraestructura. Esta métrica está disponible para las instancias de máquina virtual y las instancias con hardware dedicado. |
|
Uso de la Consola
- Abra el menú de navegación y haga clic en Recursos informáticos. En Recursos informáticos, haga clic en Instancias.
- Haga clic en la instancia en la que está interesado.
- En Recursos, haga clic en Métricas.
-
En la lista Espacio de nombre de métrica, seleccione oci_compute_infrastructure_health.
En la página Métricas se muestra un conjunto predeterminado de gráficos para la instancia actual.
Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.
- Abra el menú de navegación y haga clic en Observación y gestión. En Supervisión, haga clic en Métricas de servicio.
- Seleccionar un compartimento.
-
Para Espacio de nombre de métrica, seleccione oci_compute_infrastructure_health.
La página Métricas de servicio se actualiza dinámicamente para mostrar gráficos para cada métrica emitida por el espacio de nombres de métrica seleccionado.
Para obtener más información sobre la supervisión de métricas y el uso de alarmas, consulte Visión general de Monitoring. Para obtener más información sobre las notificaciones de alarmas, consulte Visión general de Notifications.
Uso de la API
Para obtener más información sobre el uso de la API y la firma de solicitudes, consulte la documentación de la API de REST y Credenciales de seguridad. Para obtener información sobre los SDK, consulte Los SDK y la CLI.
- API de supervisión para las métricas y alarmas
- API denotificaciones para notificaciones (se usa con alarmas)