Este problema afecta ambos servidores.
Los servidores serie SPARC M7 tienen SP redundantes, cada uno de los cuales tiene algunos dispositivos PCIe a los cuales accede Oracle Solaris para comunicarse con el SP. Cuando ocurre un evento de conmutación por error de SP que indica que un SP ha asumido la responsabilidad activa del sistema de otro SP, los dispositivos del SP anteriormente activo se eliminan de la lista de dispositivos a los cuales puede acceder Oracle Solaris.
De manera simultánea, hay un proceso en Oracle Solaris que supervisa la configuración del hardware y genera notificaciones de alerta cuando detecta que una FRU se eliminó del sistema. El problema es que este proceso de supervisión interpreta erróneamente la eliminación de los dispositivos PCIe en la FRU de SP como una indicación de que el SP se ha eliminado y, por lo tanto, se genera una notificación de eliminación de FRU cuando no corresponde. Esta notificación de eliminación de FRU se muestra en respuesta al comando fmadm faulty en Oracle Solaris. El resultado es similar al siguiente:
--------------- ------------------------------------ -------------- ---------
TIME EVENT-ID MSG-ID SEVERITY
--------------- ------------------------------------ -------------- ---------
Sep 10 14:17:06 e136d52b-6077-48ee-8e76-9655725c9738 FMD-8000-CV Minor
Problem Status : open
Diag Engine : software-diagnosis / 0.1
System
Manufacturer : Oracle Corporation
Name : SPARC M7-8
Part_Number : 32973358+1+12
Serial_Number : AK00257107
Host_ID : host-ID
----------------------------------------
Suspect 1 of 1 :
Problem class : alert.oracle.solaris.fmd.fru-monitor.fru-remove
Certainty : 100%
Affects : dev:////pci@309/pci@1
Status : faulted but still in service
FRU
Status : Active
Location : "/SYS/SP1/SPM0"
Manufacturer : unknown
Name : unknown
Part_Number : unknown
Revision : unknown
Serial_Number : unknown
Chassis
Manufacturer : Oracle-Corporation
Name : SPARC-M7-8
Part_Number : 32973358+1+12
Serial_Number : AK00257107
Description : FRU '/SYS/SP1/SPM0' has been removed from the system.
Response : FMD topology will be updated.
Impact : System impact depends on the type of FRU.
Action : Use 'fmadm faulty' to provide a more detailed view of this event.
Please refer to the associated reference document at
http://support.oracle.com/msg/FMD-8000-CV for the latest service
procedures and policies regarding this diagnosis.
Solución alternativa: ninguna. Consulte My Oracle Support (https://myoraclesupport.com) para comprobar si existe un parche para corregir este problema.
Puede borrar la alerta con este comando en el shell de gestión de fallos:
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp> fmadm acquit UUID faultmgmtsp> exit
donde UUID es el UUID del informe de fallos. En este ejemplo, el UUID es e136d52b-6077-48ee-8e76-9655725c9738.