A partir de la versión 2.3.2.2 de Oracle Hardware Management Pack, se agregaron funciones de diagnóstico mejoradas para recopilar eventos de errores del disco y de SMART, de discos conectados a Sun Storage 6 Gb SAS PCIe HBA, Internal (SGX-SAS6-INT-Z), ya sea de discos independientes o conectados a un volumen RAID.
Estos eventos de diagnóstico mejorados se capturan y se registran en /var/log/ssm/event.log cuando se está ejecutando Hardware Management Agent.
En la siguiente tabla, se muestran los eventos de diagnóstico mejorados que se registran.
|
El controlador sondea todos los discos físicos en intervalos regulares. Si un disco ha encontrado un error, el controlador genera un evento. Hardware Management Agent captura el evento y lo introduce en el log de eventos de gestión de hardware.
Para ver la información del evento en el log de eventos de gestión de hardware, escriba:
# view /var/log/ssm/event.log
Para mejorar los eventos de disco de diagnóstico, verá información similar a:
Thu Apr 30 12:32:31 2015:(CLI) Event Name : PD_MEDIA_ERROR Thu Apr 30 12:32:31 2015:(CLI) Event Description : A medium error was detected by the device that was non-recoverable. Thu Apr 30 12:32:31 2015:(CLI) ASC : 0x10 Thu Apr 30 12:32:31 2015:(CLI) ASCQ : 0x3 Thu Apr 30 12:32:31 2015:(CLI) Sense Key : 0x3 Thu Apr 30 12:32:31 2015:(CLI) Source : LSI Thu Apr 30 12:32:31 2015:(CLI) SAS Address : 0x5000cca01200fadd Thu Apr 30 12:32:31 2015:(CLI) LSI Description : Unexpected sense: PD 0c(e0xfc/s1) Path 5000cca01200fadd, CDB: 2f 00 00 fc 4d 42 00 10 00 00, Sense: 3/10/03 Thu Apr 30 12:32:31 2015:(CLI) Event TimeStamp : 04/30/2015 ; 19:30:25 Thu Apr 30 12:32:31 2015:(CLI) Node ID : 00000000:12 Thu Apr 30 12:32:31 2015:(CLI) Nac Name : /SYS/HDD1 Thu Apr 30 12:32:31 2015:(CLI) Serial Number : 001015N0JPXA PMG0JPXA Thu Apr 30 12:32:31 2015:(CLI) WWN No : PDS:5000cca01200fadd Thu Apr 30 12:32:31 2015:(CLI) Disk Model : H106030SDSUN300G
A continuación, puede usar la información de la lista de eventos para determinar cuál disco físico del sistema tiene un problema. La información como el nombre NAC de Oracle ILOM (que coincide con la etiqueta del panel frontal del sistema) y el número de serie lo ayudan a identificar el disco y la ranura de unidad en el sistema.
Para el resto de los eventos de diagnóstico que se describen en este documento, el administrador deberá consultar el log de eventos de gestión de hardware para estos eventos de disco si se sospecha que existe un problema en el disco. Actualmente, no hay mecanismos de alerta para anunciar estos eventos de manera preventiva.