Go to main content

Notas del producto de los servidores serie SPARC M7

Salir de la Vista de impresión

Actualización: Marzo de 2017
 
 

El manejo del fallo de núcleo de SPARC de QRAP aún provoca el bloqueo de la recuperación del aviso grave de Oracle Solaris (22022572)

Este problema afecta ambos servidores.

Si ocurre un error de paridad de matriz de cola del procesador SPARC, Oracle Solaris genera un aviso grave, ya que no puede continuar con un funcionamiento seguro. En raras ocasiones, es posible que Oracle Solaris no pueda reiniciarse correctamente después de un aviso grave.

Para verificar que haya ocurrido este problema, ejecute el comando fmdump -eV en el shell de gestión de fallos para verificar si existen informes electrónicos mreg-uc con el campo error-condition establecido en QRAP. Por ejemplo:

faultmgmtsp> fmdump -eV

2015-10-14/09:11:42  ereport.cpu.generic-sparc.mreg-uc@/SYS/CMIOU15/CM/CMP/SCC7/CORE3

__tod-0            = 0x561e7ead
__tod-1            = 0x1cee5cc0
tstate             = 0x4400000402
htstate            = 0x4
ehdl               = 0x1fdc100000000007
tpc                = 0x60000f022fac
tl                 = 0x1
tt                 = 0x29
diagnose           = 0x1
error-condition    = QRAP
reported-by        = Hypervisor
ps-pesr            = 0x600
ps-res-err-qhead   = 0x0
ps-res-err-qtail   = 0x0
ps-nres-err-qhead  = 0x0
ps-nres-err-qtail  = 0x0
ps-cpu-mondo-qhead = 0x0
ps-cpu-mondo-qtail = 0x800000000011b340
ps-dev-mondo-qhead = 0x0
ps-dev-mondo-qtail = 0x0

La ejecución del comando fmadm faulty debe indicar que el software de gestión de fallos ha desactivado un núcleo.

faultmgmtsp> fmadm faulty
------------------- ------------------------------------ --------------- --------
Time                UUID                                 msgid           Severity
------------------- ------------------------------------ --------------- --------
2015-11-13/05:59:06 ad7bc3bf-c0d7-657b-89e2-cc68f888c312 SPSUN4V-8000-AC Critical

Problem Status    : open
Diag Engine       : fdd 1.0
System           
   Manufacturer   : Oracle Corporation
   Name           : SPARC M7-16
   Part_Number    : 32863269+3+1
   Serial_Number  : AK00247538

----------------------------------------
Suspect 1 of 1
     Fault class  : fault.cpu.generic-sparc.core-uc
     Certainty    : 100%
     Affects      : /SYS/CMIOU15/CM/CMP/SCC7/CORE3
     Status       : faulted

     FRU                 
        Status            : faulty
        Location          : /SYS/CMIOU15
        Manufacturer      : Oracle Corporation
        Name              : CMIOU Module
        Part_Number       : 7090830
        Revision          : 04
        Serial_Number     : 465769T+14426C01MU
        Chassis          
           Manufacturer   : Oracle Corporation
           Name           : SPARC M7-16
           Part_Number    : 32863269+3+1
           Serial_Number  : AK00247538

Description : This core has encountered an uncorrectable error.

Response    : The fault manager will attempt to remove all strands
              associated with this resource from service.

Impact      : System performance may be affected.

Action      : Use 'fmadm faulty' to provide a more detailed view of this
              event. Please refer to the associated reference document at
              http://support.oracle.com/msg/SPSUN4V-8000-AC for the latest
              service procedures and policies regarding this diagnosis.

Solución alternativa: compruebe si hay una corrección para este problema en My Oracle Support (https://myoraclesupport.com).

Recuperación: desde la petición de datos de Oracle ILOM, detenga y luego inicie el host afectado.

-> stop /Servers/PDomains/PDomain_n/HOST
Are you sure you want to stop /Servers/PDomains/PDomain_n/HOST (y/n)? y
-> start /Servers/PDomains/PDomain_n/HOST
Are you sure you want to start /Servers/PDomains/PDomain_n/HOST (y/n)? y