El problema afecta al servidor SPARC M7-16 solamente.
Si el ECB de la PDECB número 0, 1, 2 o 3 se activa, se realiza un proceso de apagado y encendido del host al que pertenece la CMIOU correspondiente. Cuando el host se reinicia durante el proceso de apagado y encendido, se excluyen todos los componentes de DCU0 y DCU1.
Para verificar que haya ocurrido este problema, compruebe si aparecen los siguientes mensajes en la consola del host:
host-name-pd0 console login: 2015-11-03 11:35:17 SP> NOTICE: Fatal error occurred. Collecting diagnostic information. 2015-11-03 11:40:03 SP> NOTICE: Abort boot due to /SYS/CMIOU1. Power Cycle Host 2015-11-03 11:42:38 SP> NOTICE: Exclude all of /SYS/DCU0. Reason: Not enough power supplies 2015-11-03 11:42:38 SP> NOTICE: Exclude all of /SYS/DCU1. Reason: Not enough power supplies
De manera similar, si el ECB de la PDECB número 14, 15, 16 o 17 se activa, se excluyen todos los componentes de DCU2 y DCU3.
Solución alternativa: ninguna.
Recuperación: si ocurre este problema, se registra un fallo con la clase fault.chassis.voltage.isolated para la PDECB y su CMIOU correspondiente.
Inicie el shell de gestión de fallos.
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp>
Vea los fallos.
faultmgmtsp> fmadm faulty
------------------- ------------------------------------ -------------- --------
Time UUID msgid Severity
------------------- ------------------------------------ -------------- --------
2015-11-12/15:42:38 45ce7f9f-bd7e-4599-db3d-ef728e714f31 SPT-8001-XC Critical
Problem Status : open
Diag Engine : fdd 1.0
System
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
----------------------------------------
Suspect 1 of 1
Fault class : fault.chassis.voltage.isolated
Certainty : 100%
Affects : /SYS/PDECB1
Status : faulted
FRU
Status : faulty
Location : /SYS/PDECB1
Manufacturer : Celestica Holdings PTE LTD
Name : ECB
Part_Number : 7082640
Revision : 02
Serial_Number : 465769T+14029F01YV
Chassis
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
Description : A power supply has failed to maintain a good POK (Power On
OK) condition.
Response : The system will shutdown in a non-graceful fashion.
Impact : The platform will restart with the affected component
deconfigured.
Action : Please refer to the associated reference document at
http://support.oracle.com/msg/SPT-8001-XC for the latest
service procedures and policies regarding this diagnosis.
------------------- ------------------------------------ -------------- --------
Time UUID msgid Severity
------------------- ------------------------------------ -------------- --------
2015-11-12/15:33:20 faf9042a-5452-ee1c-d9c3-a9f6d3248c17 SPT-8001-XC Critical
Problem Status : open
Diag Engine : fdd 1.0
System
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
----------------------------------------
Suspect 1 of 1
Fault class : fault.chassis.voltage.isolated
Certainty : 100%
Affects : /SYS/CMIOU1
Status : faulted
FRU
Status : faulty
Location : /SYS/CMIOU1
Manufacturer : Oracle Corporation
Name : CMIOU Module
Part_Number : 7090838
Revision : 04
Serial_Number : 465769T+14456C01VH
Chassis
Manufacturer : Oracle Corporation
Name : SPARC M7-16
Part_Number : 32397701+7+1
Serial_Number : AK00192372
Description : A power supply has failed to maintain a good POK (Power On
OK) condition.
Response : The system will shutdown in a non-graceful fashion.
Impact : The platform will restart with the affected component
deconfigured.
Action : Please refer to the associated reference document at
http://support.oracle.com/msg/SPT-8001-XC for the latest
service procedures and policies regarding this diagnosis.
faultmgmtsp>
Algunas de las fuentes de alimentación desaparecerán de la lista de fuentes de alimentación para este host en Oracle ILOM. Esto se ilustra en el ejemplo que se muestra a continuación.
-> show /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
/Servers/PDomains/PDomain_0/System/Power/Power_Supplies
Targets:
Power_Supply_6
Power_Supply_7
Power_Supply_8
Power_Supply_9
Power_Supply_10
Power_Supply_11
Power_Supply_12
Power_Supply_13
Power_Supply_14
Power_Supply_15
...
->
Después de unos pocos minutos, deben aparecer todas las fuentes de alimentación en la lista nuevamente. Esto se ilustra en el ejemplo que se muestra a continuación.
-> show /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
/Servers/PDomains/PDomain_0/System/Power/Power_Supplies
Targets:
Power_Supply_0
Power_Supply_1
Power_Supply_2
Power_Supply_3
Power_Supply_4
Power_Supply_5
Power_Supply_6
Power_Supply_7
Power_Supply_8
Power_Supply_9
Power_Supply_10
Power_Supply_11
Power_Supply_12
Power_Supply_13
Power_Supply_14
Power_Supply_15
...
->
Cuando las fuentes de alimentación reaparezcan en Oracle ILOM, reinicie el host. Las DCU que se habían excluido anteriormente deberían mostrarse. Inicie una llamada de servicio para resolver el fallo en la PDECB.