Guía del usuario para supervisión y diagnóstico del sistema de Oracle® ILOM versión de firmware 3.2.x

Salir de la Vista de impresión

Actualización: Octubre de 2015
 
 

Terminología de gestión de fallos

Término
Descripción
Reparación automática preventiva
La recuperación automática preventiva es una arquitectura de gestión de fallos y una metodología para diagnosticar, informar y tratar condiciones de fallo del software y el hardware. La reparación automática preventiva reduce el tiempo necesario para depurar un problema de hardware o software, y proporciona al administrador del sistema o el personal de servicios de Oracle datos detallados acerca de cada fallo. La arquitectura está compuesta por un protocolo de gestión de eventos, el gestor de fallos y agentes de control de fallos y motores de diagnóstico.
Motores de diagnóstico
La arquitectura de gestión de fallos de Oracle ILOM incluye motores de diagnóstico que ejecutan eventos de fallos cuando se detecta algún error en el sistema. Para obtener una lista de los motores de diagnóstico admitidos en la arquitectura de gestión de fallos de Oracle ILOM, consulte fmstat Report Example and Description.
Estados
Oracle ILOM asocia los siguientes estados con todos los recursos para los cuales se ha recibido información de telemetría. Los estados posibles presentados en las interfaces de Oracle ILOM incluyen:
  • OK (Correcto): el recurso de hardware se encuentra en el chasis y está en uso. No se ha detectado ningún problema conocido.

  • Unknown (Desconocido): el recurso de hardware no está presente o no se puede utilizar, pero no se ha detectado ningún problema conocido. Este estado de gestión puede indicar que el recurso en cuestión fue desactivado por el administrador del sistema.

  • Faulted (Defectuoso): el recurso de hardware se encuentra en el chasis pero no se puede utilizar porque se ha detectado al menos un problema. El recurso de hardware se desactiva (fuera de línea) para evitar más daños al sistema.

  • Degraded (Degradado): el recurso de hardware se encuentra en el chasis pero se ha detectado al menos un problema. Si todos los recursos de hardware afectados tienen el mismo estado, se lo indica en el mensaje del evento que se encuentra al final de la lista. De no ser así, se indica un estado de mantenimiento independiente para cada recurso afectado.

Fallo
Un fallo indica que un componente que está presente pero no se puede utilizar o que está degradado a causa de uno o varios problemas diagnosticados por el gestor de fallos de Oracle ILOM. El componente se ha desactivado para evitar más daños al sistema.
Dispositivo gestionado
Un dispositivo gestionado puede ser un servidor montado en rack de Oracle, un servidor blade o un chasis blade.
FRU
Una FRU es una unidad sustituible en campo (por ejemplo, unidad de disco, memoria DIMM o placa de circuito impreso).
CRU
Una CRU es una unidad sustituible por el cliente (por ejemplo, un NEM de un chasis blade de Oracle).
Identificador único universal (UUID)
El UUID se utiliza para identificar de forma exclusiva un problema en cualquier juego de sistemas.