Ce problème affecte les deux serveurs.
Les serveurs de la série SPARC M7 disposent de SP redondants, qui comportent chacun des périphériques PCIe accessibles par Oracle Solaris à des fins de communication avec le SP. En cas d'événement de basculement indiquant qu'un SP a pris la responsabilité active du système par rapport à un autre, les périphériques PCIe situés sur le SP précédemment actif sont supprimés de la liste des périphériques accessibles par Oracle Solaris.
Parallèlement, il existe un processus dans Oracle Solaris qui surveille la configuration du matériel et génère des notifications d'alerte lorsqu'il voit qu'une FRU a été retirée du système. Le problème réside dans le fait que ce processus de surveillance interprète mal le retrait des périphériques PCIe sur la FRU du SP, en considérant que le SP a été retiré, et génère par conséquent une notification de retrait de FRU alors qu'une notification n'est pas justifiée. Cette notification de retrait de FRU s'affiche en réponse à la commande fmadm faulty dans Oracle Solaris. Vous obtenez une sortie similaire à ce qui suit :
--------------- ------------------------------------ -------------- --------- TIME EVENT-ID MSG-ID SEVERITY --------------- ------------------------------------ -------------- --------- Sep 10 14:17:06 e136d52b-6077-48ee-8e76-9655725c9738 FMD-8000-CV Minor Problem Status : open Diag Engine : software-diagnosis / 0.1 System Manufacturer : Oracle Corporation Name : SPARC M7-8 Part_Number : 32973358+1+12 Serial_Number : AK00257107 Host_ID : host-ID ---------------------------------------- Suspect 1 of 1 : Problem class : alert.oracle.solaris.fmd.fru-monitor.fru-remove Certainty : 100% Affects : dev:////pci@309/pci@1 Status : faulted but still in service FRU Status : Active Location : "/SYS/SP1/SPM0" Manufacturer : unknown Name : unknown Part_Number : unknown Revision : unknown Serial_Number : unknown Chassis Manufacturer : Oracle-Corporation Name : SPARC-M7-8 Part_Number : 32973358+1+12 Serial_Number : AK00257107 Description : FRU '/SYS/SP1/SPM0' has been removed from the system. Response : FMD topology will be updated. Impact : System impact depends on the type of FRU. Action : Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/FMD-8000-CV for the latest service procedures and policies regarding this diagnosis.
Solution de contournement : aucune. Recherchez un patch sur My Oracle Support (https://myoraclesupport.com) pour corriger ce problème.
Vous pouvez effacer l'alerte à l'aide de cette commande dans le shell de gestion des pannes :
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp> fmadm acquit UUID faultmgmtsp> exit
où UUID correspond à l'identifiant universel unique dans le rapport de panne. Dans cet exemple, l'UUID est e136d52b-6077-48ee-8e76-9655725c9738.