Notas del producto de los servidores serie SPARC T7

Actualización: Junio de 2017

En ocasiones, el sistema operativo Solaris no puede recuperarse después de un evento de QRAP (22022572)

En raras ocasiones, es posible que el sistema operativo Solaris no se reinicie correctamente después de un aviso grave causado por un error de paridad de matriz de cola (QRAP) del procesador SPARC.

Este error se genera si los informes electrónicos mreg-uc con el campo error-condition se configuran como QRAP.

En el shell faultmanagement, escriba:

fmdump -eV
                         __tod-0            = 0x561e7ead
                         __tod-1            = 0x1cee5cc0
                         tstate             = 0x4400000402
                         htstate            = 0x4
                         ehdl               = 0x1fdc100000000007
                         tpc                = 0x60000f022fac
                         tl                 = 0x1
                         tt                 = 0x29
                         diagnose           = 0x1
                         error-condition    = QRAP
                         reported-by        = Hypervisor
                         ps-pesr            = 0x600
                         ps-res-err-qhead   = 0x0
                         ps-res-err-qtail   = 0x0
                         ps-nres-err-qhead  = 0x0
                         ps-nres-err-qtail  = 0x0
                         ps-cpu-mondo-qhead = 0x0
                         ps-cpu-mondo-qtail = 0x800000000011b340
                         ps-dev-mondo-qhead = 0x0
                         ps-dev-mondo-qtail = 0x0

Además, la salida del comando fmadm faulty indica que el software de gestión de fallos ha desactivado un núcleo.

-> fmadm faulty
------------------- ------------------------------------ ----------------------
Time                UUID                                 msgid           Severity
------------------- ------------------------------------ ----------------------
2015-11-13/05:59:06 ad7bc3bf-c0d7-657b-89e2-cc68f888c312 SPSUN4V-8000-AC Critical

Problem Status    : open
Diag Engine       : fdd 1.0
   Manufacturer   : Oracle Corporation
   Name           : SPARC M7-16
   Part_Number    : 32863269+3+1
   Serial_Number  : AK00247538

Suspect 1 of 1
   Fault class  : fault.cpu.generic-sparc.core-uc
   Certainty    : 100%
   Affects      : /SYS/CMIOU15/CM/CMP/SCC7/CORE3
   Status       : faulted

       Status            : faulty
       Location          : /SYS/CMIOU15
       Manufacturer      : Oracle Corporation
       Name              : CMIOU Module
       Part_Number       : 7090830
       Revision          : 04
       Serial_Number     : 465769T+14426C01MU
         Manufacturer   : Oracle Corporation
         Name           : SPARC M7-16
         Part_Number    : 32863269+3+1
         Serial_Number  : AK00247538

Description : This core has encountered an uncorrectable error.

Response    : The fault manager will attempt to remove all strands
               associated with this resource from service.

Impact      : System performance may be affected.

Action      : Use 'fmadm faulty' to provide a more detailed view of this
               event. Please refer to the associated reference document at
               http://support.oracle.com/msg/SPSUN4V-8000-AC for the latest
               service procedures and policies regarding this diagnosis.


En ILOM, detenga y vuelva a iniciar el host afectado. Por ejemplo:

-> stop /HOST2
-> start /HOST2