이 문제는 두 서버 모두에 영향을 줍니다.
SPARC M7 시리즈 서버에는 중복 SP가 포함되며, 이러한 각 SP에는 SP와의 통신 목적으로 Oracle Solaris에서 액세스되는 일부 PCIe 장치가 포함됩니다. 하나의 SP가 다른 SP의 시스템에 대해 활성 책임을 수행하게 되었음을 나타내는 SP 페일오버 이벤트가 발생할 경우, Oracle Solaris에 액세스할 수 있는 장치 목록에서 이전의 활성 SP의 PCIe 장치가 제거됩니다.
이와 동시에 하드웨어 구성을 모니터하고 FRU가 시스템에서 제거되었음을 감지하는 경우 경보 알림을 생성하는 Oracle Solaris의 프로세스가 있습니다. 문제는 이 모니터링 프로세스가 SP FRU에서 PCIe 장치가 제거된 것을 SP가 제거된 것으로 잘못 해석하여 알림의 근거가 없는 경우에 FRU 제거 알림을 생성하게 됩니다. 이 FRU 제거 알림은 Oracle Solaris에서 fmadm faulty 명령에 대한 반응으로 표시됩니다. 출력은 다음과 비슷합니다.
--------------- ------------------------------------ -------------- --------- TIME EVENT-ID MSG-ID SEVERITY --------------- ------------------------------------ -------------- --------- Sep 10 14:17:06 e136d52b-6077-48ee-8e76-9655725c9738 FMD-8000-CV Minor Problem Status : open Diag Engine : software-diagnosis / 0.1 System Manufacturer : Oracle Corporation Name : SPARC M7-8 Part_Number : 32973358+1+12 Serial_Number : AK00257107 Host_ID : host-ID ---------------------------------------- Suspect 1 of 1 : Problem class : alert.oracle.solaris.fmd.fru-monitor.fru-remove Certainty : 100% Affects : dev:////pci@309/pci@1 Status : faulted but still in service FRU Status : Active Location : "/SYS/SP1/SPM0" Manufacturer : unknown Name : unknown Part_Number : unknown Revision : unknown Serial_Number : unknown Chassis Manufacturer : Oracle-Corporation Name : SPARC-M7-8 Part_Number : 32973358+1+12 Serial_Number : AK00257107 Description : FRU '/SYS/SP1/SPM0' has been removed from the system. Response : FMD topology will be updated. Impact : System impact depends on the type of FRU. Action : Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/FMD-8000-CV for the latest service procedures and policies regarding this diagnosis.
임시해결책: 없습니다. My Oracle Support (https://myoraclesupport.com)에서 이 문제를 해결하기 위한 패치를 확인합니다.
결함 관리 셸에서 다음 명령을 사용하여 경보를 지울 수 있습니다.
-> start /SP/faultmgmt/shell Are you sure you want to start /SP/faultmgmt/shell (y/n)? y faultmgmtsp> fmadm acquit UUID faultmgmtsp> exit
여기서 UUID는 결함 보고서의 UUID입니다. 이 예에서 UUID는 e136d52b-6077-48ee-8e76-9655725c9738입니다.