Go to main content

SPARC M7 시리즈 서버 제품 안내서

인쇄 보기 종료

업데이트 날짜: 2017년 3월
 
 

다중 LDom 시스템의 pciexdev 노드에서 FRU 추가 및 제거 경보 숨김(22286820)

이 문제는 두 서버 모두에 영향을 줍니다.


주 -  이 문제는 SP 페일오버와 관련이 있습니다. SP 페일오버와 관련된 모든 문제를 이해하기 위해서는 플랫폼 사용자 지침을 참조하십시오.

SPARC M7 시리즈 서버에는 중복 SP가 포함되며, 이러한 각 SP에는 SP와의 통신 목적으로 Oracle Solaris에서 액세스되는 일부 PCIe 장치가 포함됩니다. 하나의 SP가 다른 SP의 시스템에 대해 활성 책임을 수행하게 되었음을 나타내는 SP 페일오버 이벤트가 발생할 경우, Oracle Solaris에 액세스할 수 있는 장치 목록에서 이전의 활성 SP의 PCIe 장치가 제거됩니다.

이와 동시에 하드웨어 구성을 모니터하고 FRU가 시스템에서 제거되었음을 감지하는 경우 경보 알림을 생성하는 Oracle Solaris의 프로세스가 있습니다. 문제는 이 모니터링 프로세스가 SP FRU에서 PCIe 장치가 제거된 것을 SP가 제거된 것으로 잘못 해석하여 알림의 근거가 없는 경우에 FRU 제거 알림을 생성하게 됩니다. 이 FRU 제거 알림은 Oracle Solaris에서 fmadm faulty 명령에 대한 반응으로 표시됩니다. 출력은 다음과 비슷합니다.

--------------- ------------------------------------  -------------- ---------
TIME            EVENT-ID                              MSG-ID         SEVERITY
--------------- ------------------------------------  -------------- ---------
Sep 10 14:17:06 e136d52b-6077-48ee-8e76-9655725c9738  FMD-8000-CV    Minor    

Problem Status    : open
Diag Engine       : software-diagnosis / 0.1
System
    Manufacturer  : Oracle Corporation
    Name          : SPARC M7-8
    Part_Number   : 32973358+1+12
    Serial_Number : AK00257107
    Host_ID       : host-ID

----------------------------------------
Suspect 1 of 1 :
   Problem class : alert.oracle.solaris.fmd.fru-monitor.fru-remove
   Certainty   : 100%
   Affects     : dev:////pci@309/pci@1
   Status      : faulted but still in service

   FRU
     Status           : Active
     Location         : "/SYS/SP1/SPM0"
     Manufacturer     : unknown
     Name             : unknown
     Part_Number      : unknown
     Revision         : unknown
     Serial_Number    : unknown
     Chassis
        Manufacturer  : Oracle-Corporation
        Name          : SPARC-M7-8
        Part_Number   : 32973358+1+12
        Serial_Number : AK00257107

Description : FRU '/SYS/SP1/SPM0' has been removed from the system.

Response    : FMD topology will be updated.

Impact      : System impact depends on the type of FRU.

Action      : Use 'fmadm faulty' to provide a more detailed view of this event.
              Please refer to the associated reference document at
              http://support.oracle.com/msg/FMD-8000-CV for the latest service
              procedures and policies regarding this diagnosis.

임시해결책: 없습니다. My Oracle Support (https://myoraclesupport.com)에서 이 문제를 해결하기 위한 패치를 확인합니다.

결함 관리 셸에서 다음 명령을 사용하여 경보를 지울 수 있습니다.

-> start /SP/faultmgmt/shell
Are you sure you want to start /SP/faultmgmt/shell (y/n)? y

faultmgmtsp> fmadm acquit UUID
faultmgmtsp> exit

여기서 UUID는 결함 보고서의 UUID입니다. 이 예에서 UUID는 e136d52b-6077-48ee-8e76-9655725c9738입니다.