Go to main content

Notes de produit des serveurs de la série SPARC M7

Quitter la vue de l'impression

Mis à jour : Mars 2017
 
 

Suppression des alertes d'ajout et de retrait de FRU sur les noeuds pciexdev dans les systèmes comportant plusieurs domaines logiques (22286820)

Ce problème affecte les deux serveurs.


Remarque -  Ce problème implique un basculement de SP. Pour comprendre tous les problèmes liés au basculement d'un SP, reportez-vous à la section Instructions relatives aux utilisateurs de la plate-forme.

Les serveurs de la série SPARC M7 disposent de SP redondants, qui comportent chacun des périphériques PCIe accessibles par Oracle Solaris à des fins de communication avec le SP. En cas d'événement de basculement indiquant qu'un SP a pris la responsabilité active du système par rapport à un autre, les périphériques PCIe situés sur le SP précédemment actif sont supprimés de la liste des périphériques accessibles par Oracle Solaris.

Parallèlement, il existe un processus dans Oracle Solaris qui surveille la configuration du matériel et génère des notifications d'alerte lorsqu'il voit qu'une FRU a été retirée du système. Le problème réside dans le fait que ce processus de surveillance interprète mal le retrait des périphériques PCIe sur la FRU du SP, en considérant que le SP a été retiré, et génère par conséquent une notification de retrait de FRU alors qu'une notification n'est pas justifiée. Cette notification de retrait de FRU s'affiche en réponse à la commande fmadm faulty dans Oracle Solaris. Vous obtenez une sortie similaire à ce qui suit :

--------------- ------------------------------------  -------------- ---------
TIME            EVENT-ID                              MSG-ID         SEVERITY
--------------- ------------------------------------  -------------- ---------
Sep 10 14:17:06 e136d52b-6077-48ee-8e76-9655725c9738  FMD-8000-CV    Minor    

Problem Status    : open
Diag Engine       : software-diagnosis / 0.1
System
    Manufacturer  : Oracle Corporation
    Name          : SPARC M7-8
    Part_Number   : 32973358+1+12
    Serial_Number : AK00257107
    Host_ID       : host-ID

----------------------------------------
Suspect 1 of 1 :
   Problem class : alert.oracle.solaris.fmd.fru-monitor.fru-remove
   Certainty   : 100%
   Affects     : dev:////pci@309/pci@1
   Status      : faulted but still in service

   FRU
     Status           : Active
     Location         : "/SYS/SP1/SPM0"
     Manufacturer     : unknown
     Name             : unknown
     Part_Number      : unknown
     Revision         : unknown
     Serial_Number    : unknown
     Chassis
        Manufacturer  : Oracle-Corporation
        Name          : SPARC-M7-8
        Part_Number   : 32973358+1+12
        Serial_Number : AK00257107

Description : FRU '/SYS/SP1/SPM0' has been removed from the system.

Response    : FMD topology will be updated.

Impact      : System impact depends on the type of FRU.

Action      : Use 'fmadm faulty' to provide a more detailed view of this event.
              Please refer to the associated reference document at
              http://support.oracle.com/msg/FMD-8000-CV for the latest service
              procedures and policies regarding this diagnosis.

Solution de contournement : aucune. Recherchez un patch sur My Oracle Support (https://myoraclesupport.com) pour corriger ce problème.

Vous pouvez effacer l'alerte à l'aide de cette commande dans le shell de gestion des pannes :

-> start /SP/faultmgmt/shell
Are you sure you want to start /SP/faultmgmt/shell (y/n)? y

faultmgmtsp> fmadm acquit UUID
faultmgmtsp> exit

UUID correspond à l'identifiant universel unique dans le rapport de panne. Dans cet exemple, l'UUID est e136d52b-6077-48ee-8e76-9655725c9738.