Este problema afecta ambos servidores.
Los servidores serie SPARC M7 tienen SP redundantes, cada uno de los cuales tiene algunos dispositivos PCIe a los cuales accede Oracle Solaris para comunicarse con el SP. Cuando ocurre un evento de conmutación por error de SP que indica que un SP ha asumido la responsabilidad activa del sistema de otro SP, los dispositivos del SP anteriormente activo se eliminan de la lista de dispositivos a los cuales puede acceder Oracle Solaris.
De manera simultánea, hay un proceso en Oracle Solaris que supervisa la configuración del hardware y genera notificaciones de alerta cuando detecta que una FRU se eliminó del sistema. El problema es que este proceso de supervisión interpreta erróneamente la eliminación de los dispositivos PCIe en la FRU de SP como una indicación de que el SP se ha eliminado y, por lo tanto, se genera una notificación de eliminación de FRU cuando no corresponde. Esta notificación de eliminación de FRU se muestra en respuesta al comando fmadm faulty en Oracle Solaris. El resultado es similar al siguiente:
--------------- ------------------------------------ -------------- --------- TIME EVENT-ID MSG-ID SEVERITY --------------- ------------------------------------ -------------- --------- Sep 10 14:17:06 e136d52b-6077-48ee-8e76-9655725c9738 FMD-8000-CV Minor Problem Status : open Diag Engine : software-diagnosis / 0.1 System Manufacturer : Oracle Corporation Name : SPARC M7-8 Part_Number : 32973358+1+12 Serial_Number : AK00257107 Host_ID : host-ID ---------------------------------------- Suspect 1 of 1 : Problem class : alert.oracle.solaris.fmd.fru-monitor.fru-remove Certainty : 100% Affects : dev:////pci@309/pci@1 Status : faulted but still in service FRU Status : Active Location : "/SYS/SP1/SPM0" Manufacturer : unknown Name : unknown Part_Number : unknown Revision : unknown Serial_Number : unknown Chassis Manufacturer : Oracle-Corporation Name : SPARC-M7-8 Part_Number : 32973358+1+12 Serial_Number : AK00257107 Description : FRU '/SYS/SP1/SPM0' has been removed from the system. Response : FMD topology will be updated. Impact : System impact depends on the type of FRU. Action : Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/FMD-8000-CV for the latest service procedures and policies regarding this diagnosis.
Solución alternativa: ninguna. Consulte My Oracle Support (https://myoraclesupport.com) para comprobar si existe un parche para corregir este problema.
Puede borrar la alerta con este comando en el shell de gestión de fallos:
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp> fmadm acquit UUID faultmgmtsp> exit
donde UUID es el UUID del informe de fallos. En este ejemplo, el UUID es e136d52b-6077-48ee-8e76-9655725c9738.