Go to main content

SPARC T7 시리즈 서버 제품 안내서

인쇄 보기 종료

업데이트 날짜: 2017년 6월
 
 

QRAP 이벤트 후 가끔씩 Solaris OS가 복구되지 않음(22022572)

드문 경우지만, SPARC 프로세서 대기열 배열 패리티 오류(QRAP)로 인해 패닉이 발생한 후 Solaris OS가 재부트되지 않을 수 있습니다.

이 문제는 mreg-uc ereports에서 error-condition 필드가 QRAP로 설정된 경우에 표시됩니다.

faultmanagement 셸에서 다음과 같이 입력합니다.

fmdump -eV
2015-10-14/09:11:42  
ereport.cpu.generic-sparc.mreg-uc@/SYS/CMIOU15/CM/CMP/SCC7/CORE3
                         __tod-0            = 0x561e7ead
                         __tod-1            = 0x1cee5cc0
                         tstate             = 0x4400000402
                         htstate            = 0x4
                         ehdl               = 0x1fdc100000000007
                         tpc                = 0x60000f022fac
                         tl                 = 0x1
                         tt                 = 0x29
                         diagnose           = 0x1
                         error-condition    = QRAP
                         reported-by        = Hypervisor
                         ps-pesr            = 0x600
                         ps-res-err-qhead   = 0x0
                         ps-res-err-qtail   = 0x0
                         ps-nres-err-qhead  = 0x0
                         ps-nres-err-qtail  = 0x0
                         ps-cpu-mondo-qhead = 0x0
                         ps-cpu-mondo-qtail = 0x800000000011b340
                         ps-dev-mondo-qhead = 0x0
                         ps-dev-mondo-qtail = 0x0

또한 fmadm faulty 명령의 출력에는 코어가 결함 관리 소프트웨어에 의해 사용 안함으로 설정된 것으로 표시됩니다.

-> fmadm faulty
------------------- ------------------------------------ ----------------------
Time                UUID                                 msgid           Severity
------------------- ------------------------------------ ----------------------
2015-11-13/05:59:06 ad7bc3bf-c0d7-657b-89e2-cc68f888c312 SPSUN4V-8000-AC Critical

Problem Status    : open
Diag Engine       : fdd 1.0
System          
   Manufacturer   : Oracle Corporation
   Name           : SPARC M7-16
   Part_Number    : 32863269+3+1
   Serial_Number  : AK00247538

----------------------------------------
Suspect 1 of 1
   Fault class  : fault.cpu.generic-sparc.core-uc
   Certainty    : 100%
   Affects      : /SYS/CMIOU15/CM/CMP/SCC7/CORE3
   Status       : faulted

   FRU                
       Status            : faulty
       Location          : /SYS/CMIOU15
       Manufacturer      : Oracle Corporation
       Name              : CMIOU Module
       Part_Number       : 7090830
       Revision          : 04
       Serial_Number     : 465769T+14426C01MU
       Chassis          
         Manufacturer   : Oracle Corporation
         Name           : SPARC M7-16
         Part_Number    : 32863269+3+1
         Serial_Number  : AK00247538

Description : This core has encountered an uncorrectable error.

Response    : The fault manager will attempt to remove all strands
               associated with this resource from service.

Impact      : System performance may be affected.

Action      : Use 'fmadm faulty' to provide a more detailed view of this
               event. Please refer to the associated reference document at
               http://support.oracle.com/msg/SPSUN4V-8000-AC for the latest
               service procedures and policies regarding this diagnosis.

복구

ILOM에서 영향을 받는 호스트를 중지한 후 시작합니다. 예를 들어, 다음과 같습니다.

-> stop /HOST2
-> start /HOST2