Go to main content

SPARC M7 시리즈 서버 제품 안내서

인쇄 보기 종료

업데이트 날짜: 2017년 3월
 
 

QRAP SPARC 코어 결함을 처리하면 계속 Oracle Solaris 패닉 복구가 중단됨(22022572)

이 문제는 두 서버 모두에 영향을 줍니다.

SPARC 프로세서 대기열 어레이 패리티 오류가 발생하는 경우 Oracle Solaris에서 안전한 작업을 진행할 수 없기 때문에 패닉이 발생합니다. 드문 경우이지만 Oracle Solaris는 패닉이 발생한 이후 재부트에 실패할 수 있습니다.

이 문제가 발생했는지 확인하려면 결함 관리 셸에서 fmdump -eV 명령을 실행하여 error-condition 필드가 QRAP로 설정된 mreg-uc ereport를 확인합니다. 예를 들면 다음과 같습니다.

faultmgmtsp> fmdump -eV

2015-10-14/09:11:42  ereport.cpu.generic-sparc.mreg-uc@/SYS/CMIOU15/CM/CMP/SCC7/CORE3

__tod-0            = 0x561e7ead
__tod-1            = 0x1cee5cc0
tstate             = 0x4400000402
htstate            = 0x4
ehdl               = 0x1fdc100000000007
tpc                = 0x60000f022fac
tl                 = 0x1
tt                 = 0x29
diagnose           = 0x1
error-condition    = QRAP
reported-by        = Hypervisor
ps-pesr            = 0x600
ps-res-err-qhead   = 0x0
ps-res-err-qtail   = 0x0
ps-nres-err-qhead  = 0x0
ps-nres-err-qtail  = 0x0
ps-cpu-mondo-qhead = 0x0
ps-cpu-mondo-qtail = 0x800000000011b340
ps-dev-mondo-qhead = 0x0
ps-dev-mondo-qtail = 0x0

fmadm faulty 명령을 실행하면 결함 관리 소프트웨어가 코어를 사용 안함으로 설정했음이 표시돼야 합니다.

faultmgmtsp> fmadm faulty
------------------- ------------------------------------ --------------- --------
Time                UUID                                 msgid           Severity
------------------- ------------------------------------ --------------- --------
2015-11-13/05:59:06 ad7bc3bf-c0d7-657b-89e2-cc68f888c312 SPSUN4V-8000-AC Critical

Problem Status    : open
Diag Engine       : fdd 1.0
System           
   Manufacturer   : Oracle Corporation
   Name           : SPARC M7-16
   Part_Number    : 32863269+3+1
   Serial_Number  : AK00247538

----------------------------------------
Suspect 1 of 1
     Fault class  : fault.cpu.generic-sparc.core-uc
     Certainty    : 100%
     Affects      : /SYS/CMIOU15/CM/CMP/SCC7/CORE3
     Status       : faulted

     FRU                 
        Status            : faulty
        Location          : /SYS/CMIOU15
        Manufacturer      : Oracle Corporation
        Name              : CMIOU Module
        Part_Number       : 7090830
        Revision          : 04
        Serial_Number     : 465769T+14426C01MU
        Chassis          
           Manufacturer   : Oracle Corporation
           Name           : SPARC M7-16
           Part_Number    : 32863269+3+1
           Serial_Number  : AK00247538

Description : This core has encountered an uncorrectable error.

Response    : The fault manager will attempt to remove all strands
              associated with this resource from service.

Impact      : System performance may be affected.

Action      : Use 'fmadm faulty' to provide a more detailed view of this
              event. Please refer to the associated reference document at
              http://support.oracle.com/msg/SPSUN4V-8000-AC for the latest
              service procedures and policies regarding this diagnosis.

임시해결책: 이 문제를 수정하려면 My Oracle Support (https://myoraclesupport.com)를 확인하십시오.

복구: Oracle ILOM 프롬프트에서 영향을 받는 호스트를 중지한 다음 시작합니다.

-> stop /Servers/PDomains/PDomain_n/HOST
Are you sure you want to stop /Servers/PDomains/PDomain_n/HOST (y/n)? y
-> start /Servers/PDomains/PDomain_n/HOST
Are you sure you want to start /Servers/PDomains/PDomain_n/HOST (y/n)? y