Go to main content

Notas del producto de los servidores serie SPARC M7

Salir de la Vista de impresión

Actualización: Marzo de 2017
 
 

El inicio del host no debe excluir DCU completas cuando se apaga una PDECB (22146616)

El problema afecta al servidor SPARC M7-16 solamente.


Notas -  Este problema implica un proceso de apagado y encendido. Para obtener información sobre los problemas que conlleva el ciclo de apagado y encendido de hosts, consulte Directrices para usuarios de la plataforma.

Si el ECB de la PDECB número 0, 1, 2 o 3 se activa, se realiza un proceso de apagado y encendido del host al que pertenece la CMIOU correspondiente. Cuando el host se reinicia durante el proceso de apagado y encendido, se excluyen todos los componentes de DCU0 y DCU1.

Para verificar que haya ocurrido este problema, compruebe si aparecen los siguientes mensajes en la consola del host:

host-name-pd0 console login: 
2015-11-03 11:35:17      SP> NOTICE:  Fatal error occurred. Collecting diagnostic information.
2015-11-03 11:40:03      SP> NOTICE:  Abort boot due to /SYS/CMIOU1. Power Cycle Host
2015-11-03 11:42:38      SP> NOTICE:  Exclude all of /SYS/DCU0. Reason: Not enough power supplies
2015-11-03 11:42:38      SP> NOTICE:  Exclude all of /SYS/DCU1. Reason: Not enough power supplies

De manera similar, si el ECB de la PDECB número 14, 15, 16 o 17 se activa, se excluyen todos los componentes de DCU2 y DCU3.

Solución alternativa: ninguna.

Recuperación: si ocurre este problema, se registra un fallo con la clase fault.chassis.voltage.isolated para la PDECB y su CMIOU correspondiente.

  1. Inicie el shell de gestión de fallos.

    -> start /SP/faultmgmt/shell
    Are you sure you want to start /SP/faultmgmt/shell (y/n)? y
    faultmgmtsp>
  2. Vea los fallos.

    faultmgmtsp> fmadm faulty
    
    ------------------- ------------------------------------ -------------- --------
    Time                UUID                                 msgid          Severity
    ------------------- ------------------------------------ -------------- --------
    2015-11-12/15:42:38 45ce7f9f-bd7e-4599-db3d-ef728e714f31 SPT-8001-XC    Critical
    
    Problem Status    : open
    Diag Engine       : fdd 1.0
    System           
       Manufacturer   : Oracle Corporation
       Name           : SPARC M7-16
       Part_Number    : 32397701+7+1
       Serial_Number  : AK00192372
    
    ----------------------------------------
    Suspect 1 of 1
       Fault class  : fault.chassis.voltage.isolated
       Certainty    : 100%
       Affects      : /SYS/PDECB1
       Status       : faulted
    
       FRU                 
          Status            : faulty
          Location          : /SYS/PDECB1
          Manufacturer      : Celestica Holdings PTE LTD
          Name              : ECB
          Part_Number       : 7082640
          Revision          : 02
          Serial_Number     : 465769T+14029F01YV
          Chassis          
             Manufacturer   : Oracle Corporation
             Name           : SPARC M7-16
             Part_Number    : 32397701+7+1
             Serial_Number  : AK00192372
    
    Description : A power supply has failed to maintain a good POK (Power On
                  OK) condition.
    
    Response    : The system will shutdown in a non-graceful fashion.
    
    Impact      : The platform will restart with the affected component
                  deconfigured.
    
    Action      : Please refer to the associated reference document at
                  http://support.oracle.com/msg/SPT-8001-XC for the latest
                  service procedures and policies regarding this diagnosis.
    
    ------------------- ------------------------------------ -------------- --------
    Time                UUID                                 msgid          Severity
    ------------------- ------------------------------------ -------------- --------
    2015-11-12/15:33:20 faf9042a-5452-ee1c-d9c3-a9f6d3248c17 SPT-8001-XC    Critical
    
    Problem Status    : open
    Diag Engine       : fdd 1.0
    System           
       Manufacturer   : Oracle Corporation
       Name           : SPARC M7-16
       Part_Number    : 32397701+7+1
       Serial_Number  : AK00192372
    
    ----------------------------------------
    Suspect 1 of 1
       Fault class  : fault.chassis.voltage.isolated
       Certainty    : 100%
       Affects      : /SYS/CMIOU1
       Status       : faulted
    
       FRU                 
          Status            : faulty
          Location          : /SYS/CMIOU1
          Manufacturer      : Oracle Corporation
          Name              : CMIOU Module
          Part_Number       : 7090838
          Revision          : 04
          Serial_Number     : 465769T+14456C01VH
          Chassis          
             Manufacturer   : Oracle Corporation
             Name           : SPARC M7-16
             Part_Number    : 32397701+7+1
             Serial_Number  : AK00192372
    
    Description : A power supply has failed to maintain a good POK (Power On
                  OK) condition.
    
    Response    : The system will shutdown in a non-graceful fashion.
    
    Impact      : The platform will restart with the affected component
                  deconfigured.
    
    Action      : Please refer to the associated reference document at
                  http://support.oracle.com/msg/SPT-8001-XC for the latest
                  service procedures and policies regarding this diagnosis.
    
    faultmgmtsp>

    Algunas de las fuentes de alimentación desaparecerán de la lista de fuentes de alimentación para este host en Oracle ILOM. Esto se ilustra en el ejemplo que se muestra a continuación.

    -> show  /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
    
     /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
        Targets:
            Power_Supply_6
            Power_Supply_7
            Power_Supply_8
            Power_Supply_9
            Power_Supply_10
            Power_Supply_11
            Power_Supply_12
            Power_Supply_13
            Power_Supply_14
            Power_Supply_15
    ...
    -> 

    Después de unos pocos minutos, deben aparecer todas las fuentes de alimentación en la lista nuevamente. Esto se ilustra en el ejemplo que se muestra a continuación.

    -> show  /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
    
     /Servers/PDomains/PDomain_0/System/Power/Power_Supplies
        Targets:
            Power_Supply_0
            Power_Supply_1
            Power_Supply_2
            Power_Supply_3
            Power_Supply_4
            Power_Supply_5
            Power_Supply_6
            Power_Supply_7
            Power_Supply_8
            Power_Supply_9
            Power_Supply_10
            Power_Supply_11
            Power_Supply_12
            Power_Supply_13
            Power_Supply_14
            Power_Supply_15
    ...
    ->
  3. Cuando las fuentes de alimentación reaparezcan en Oracle ILOM, reinicie el host. Las DCU que se habían excluido anteriormente deberían mostrarse. Inicie una llamada de servicio para resolver el fallo en la PDECB.