Go to main content

Notes de produit des serveurs de la série SPARC M7

Quitter la vue de l'impression

Mis à jour : Mars 2017
 
 

La gestion de la panne du coeur QRAP SPARC entraîne toujours le blocage de la récupération en cas de panique d'Oracle Solaris (22022572)

Ce problème affecte les deux serveurs.

Si une erreur de parité de baie de file d'attente d'un processeur SPARC survient, Oracle Solaris panique car il ne peut pas continuer à fonctionner de façon sûre. Dans de rares occasions, Oracle Solaris ne parvient pas à redémarrer correctement après la panique.

Pour vérifier que vous avez rencontré ce problème, exécutez la commande fmdump -eV dans le shell de gestion des pannes afin d'identifier les rapports électroniques mreg-uc dont le champ error-condition est défini sur QRAP. Par exemple :

faultmgmtsp> fmdump -eV

2015-10-14/09:11:42  ereport.cpu.generic-sparc.mreg-uc@/SYS/CMIOU15/CM/CMP/SCC7/CORE3

__tod-0            = 0x561e7ead
__tod-1            = 0x1cee5cc0
tstate             = 0x4400000402
htstate            = 0x4
ehdl               = 0x1fdc100000000007
tpc                = 0x60000f022fac
tl                 = 0x1
tt                 = 0x29
diagnose           = 0x1
error-condition    = QRAP
reported-by        = Hypervisor
ps-pesr            = 0x600
ps-res-err-qhead   = 0x0
ps-res-err-qtail   = 0x0
ps-nres-err-qhead  = 0x0
ps-nres-err-qtail  = 0x0
ps-cpu-mondo-qhead = 0x0
ps-cpu-mondo-qtail = 0x800000000011b340
ps-dev-mondo-qhead = 0x0
ps-dev-mondo-qtail = 0x0

L'exécution de la commande fmadm faulty doit indiquer qu'un coeur a été désactivé par le logiciel de gestion des pannes.

faultmgmtsp> fmadm faulty
------------------- ------------------------------------ --------------- --------
Time                UUID                                 msgid           Severity
------------------- ------------------------------------ --------------- --------
2015-11-13/05:59:06 ad7bc3bf-c0d7-657b-89e2-cc68f888c312 SPSUN4V-8000-AC Critical

Problem Status    : open
Diag Engine       : fdd 1.0
System           
   Manufacturer   : Oracle Corporation
   Name           : SPARC M7-16
   Part_Number    : 32863269+3+1
   Serial_Number  : AK00247538

----------------------------------------
Suspect 1 of 1
     Fault class  : fault.cpu.generic-sparc.core-uc
     Certainty    : 100%
     Affects      : /SYS/CMIOU15/CM/CMP/SCC7/CORE3
     Status       : faulted

     FRU                 
        Status            : faulty
        Location          : /SYS/CMIOU15
        Manufacturer      : Oracle Corporation
        Name              : CMIOU Module
        Part_Number       : 7090830
        Revision          : 04
        Serial_Number     : 465769T+14426C01MU
        Chassis          
           Manufacturer   : Oracle Corporation
           Name           : SPARC M7-16
           Part_Number    : 32863269+3+1
           Serial_Number  : AK00247538

Description : This core has encountered an uncorrectable error.

Response    : The fault manager will attempt to remove all strands
              associated with this resource from service.

Impact      : System performance may be affected.

Action      : Use 'fmadm faulty' to provide a more detailed view of this
              event. Please refer to the associated reference document at
              http://support.oracle.com/msg/SPSUN4V-8000-AC for the latest
              service procedures and policies regarding this diagnosis.

Solution de contournement : vérifiez si un correctif du problème existe sur My Oracle Support (https://myoraclesupport.com).

Récupération : depuis l'invite Oracle ILOM, arrêtez puis redémarrez l'hôte concerné.

-> stop /Servers/PDomains/PDomain_n/HOST
Are you sure you want to stop /Servers/PDomains/PDomain_n/HOST (y/n)? y
-> start /Servers/PDomains/PDomain_n/HOST
Are you sure you want to start /Servers/PDomains/PDomain_n/HOST (y/n)? y