El problema afecta al servidor SPARC M7-16 solamente.
Si el ECB de la PDECB número 0, 1, 2 o 3 se activa, se realiza un proceso de apagado y encendido del host al que pertenece la CMIOU correspondiente. Cuando el host se reinicia durante el proceso de apagado y encendido, se excluyen todos los componentes de DCU0 y DCU1.
Para verificar que haya ocurrido este problema, compruebe si aparecen los siguientes mensajes en la consola del host:
host-name-pd0 console login: 2015-11-03 11:35:17 SP> NOTICE: Fatal error occurred. Collecting diagnostic information. 2015-11-03 11:40:03 SP> NOTICE: Abort boot due to /SYS/CMIOU1. Power Cycle Host 2015-11-03 11:42:38 SP> NOTICE: Exclude all of /SYS/DCU0. Reason: Not enough power supplies 2015-11-03 11:42:38 SP> NOTICE: Exclude all of /SYS/DCU1. Reason: Not enough power supplies
De manera similar, si el ECB de la PDECB número 14, 15, 16 o 17 se activa, se excluyen todos los componentes de DCU2 y DCU3.
Solución alternativa: ninguna.
Recuperación: si ocurre este problema, se registra un fallo con la clase fault.chassis.voltage.isolated para la PDECB y su CMIOU correspondiente.
Inicie el shell de gestión de fallos.
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp>
Vea los fallos.
faultmgmtsp> fmadm faulty ------------------- ------------------------------------ -------------- -------- Time UUID msgid Severity ------------------- ------------------------------------ -------------- -------- 2015-11-12/15:42:38 45ce7f9f-bd7e-4599-db3d-ef728e714f31 SPT-8001-XC Critical Problem Status : open Diag Engine : fdd 1.0 System Manufacturer : Oracle Corporation Name : SPARC M7-16 Part_Number : 32397701+7+1 Serial_Number : AK00192372 ---------------------------------------- Suspect 1 of 1 Fault class : fault.chassis.voltage.isolated Certainty : 100% Affects : /SYS/PDECB1 Status : faulted FRU Status : faulty Location : /SYS/PDECB1 Manufacturer : Celestica Holdings PTE LTD Name : ECB Part_Number : 7082640 Revision : 02 Serial_Number : 465769T+14029F01YV Chassis Manufacturer : Oracle Corporation Name : SPARC M7-16 Part_Number : 32397701+7+1 Serial_Number : AK00192372 Description : A power supply has failed to maintain a good POK (Power On OK) condition. Response : The system will shutdown in a non-graceful fashion. Impact : The platform will restart with the affected component deconfigured. Action : Please refer to the associated reference document at http://support.oracle.com/msg/SPT-8001-XC for the latest service procedures and policies regarding this diagnosis. ------------------- ------------------------------------ -------------- -------- Time UUID msgid Severity ------------------- ------------------------------------ -------------- -------- 2015-11-12/15:33:20 faf9042a-5452-ee1c-d9c3-a9f6d3248c17 SPT-8001-XC Critical Problem Status : open Diag Engine : fdd 1.0 System Manufacturer : Oracle Corporation Name : SPARC M7-16 Part_Number : 32397701+7+1 Serial_Number : AK00192372 ---------------------------------------- Suspect 1 of 1 Fault class : fault.chassis.voltage.isolated Certainty : 100% Affects : /SYS/CMIOU1 Status : faulted FRU Status : faulty Location : /SYS/CMIOU1 Manufacturer : Oracle Corporation Name : CMIOU Module Part_Number : 7090838 Revision : 04 Serial_Number : 465769T+14456C01VH Chassis Manufacturer : Oracle Corporation Name : SPARC M7-16 Part_Number : 32397701+7+1 Serial_Number : AK00192372 Description : A power supply has failed to maintain a good POK (Power On OK) condition. Response : The system will shutdown in a non-graceful fashion. Impact : The platform will restart with the affected component deconfigured. Action : Please refer to the associated reference document at http://support.oracle.com/msg/SPT-8001-XC for the latest service procedures and policies regarding this diagnosis. faultmgmtsp>
Algunas de las fuentes de alimentación desaparecerán de la lista de fuentes de alimentación para este host en Oracle ILOM. Esto se ilustra en el ejemplo que se muestra a continuación.
-> show /Servers/PDomains/PDomain_0/System/Power/Power_Supplies /Servers/PDomains/PDomain_0/System/Power/Power_Supplies Targets: Power_Supply_6 Power_Supply_7 Power_Supply_8 Power_Supply_9 Power_Supply_10 Power_Supply_11 Power_Supply_12 Power_Supply_13 Power_Supply_14 Power_Supply_15 ... ->
Después de unos pocos minutos, deben aparecer todas las fuentes de alimentación en la lista nuevamente. Esto se ilustra en el ejemplo que se muestra a continuación.
-> show /Servers/PDomains/PDomain_0/System/Power/Power_Supplies /Servers/PDomains/PDomain_0/System/Power/Power_Supplies Targets: Power_Supply_0 Power_Supply_1 Power_Supply_2 Power_Supply_3 Power_Supply_4 Power_Supply_5 Power_Supply_6 Power_Supply_7 Power_Supply_8 Power_Supply_9 Power_Supply_10 Power_Supply_11 Power_Supply_12 Power_Supply_13 Power_Supply_14 Power_Supply_15 ... ->
Cuando las fuentes de alimentación reaparezcan en Oracle ILOM, reinicie el host. Las DCU que se habían excluido anteriormente deberían mostrarse. Inicie una llamada de servicio para resolver el fallo en la PDECB.