이 문제는 두 서버 모두에 영향을 줍니다.
SPARC 프로세서 대기열 어레이 패리티 오류가 발생하는 경우 Oracle Solaris에서 안전한 작업을 진행할 수 없기 때문에 패닉이 발생합니다. 드문 경우이지만 Oracle Solaris는 패닉이 발생한 이후 재부트에 실패할 수 있습니다.
이 문제가 발생했는지 확인하려면 결함 관리 셸에서 fmdump -eV 명령을 실행하여 error-condition 필드가 QRAP로 설정된 mreg-uc ereport를 확인합니다. 예를 들면 다음과 같습니다.
faultmgmtsp> fmdump -eV 2015-10-14/09:11:42 ereport.cpu.generic-sparc.mreg-uc@/SYS/CMIOU15/CM/CMP/SCC7/CORE3 __tod-0 = 0x561e7ead __tod-1 = 0x1cee5cc0 tstate = 0x4400000402 htstate = 0x4 ehdl = 0x1fdc100000000007 tpc = 0x60000f022fac tl = 0x1 tt = 0x29 diagnose = 0x1 error-condition = QRAP reported-by = Hypervisor ps-pesr = 0x600 ps-res-err-qhead = 0x0 ps-res-err-qtail = 0x0 ps-nres-err-qhead = 0x0 ps-nres-err-qtail = 0x0 ps-cpu-mondo-qhead = 0x0 ps-cpu-mondo-qtail = 0x800000000011b340 ps-dev-mondo-qhead = 0x0 ps-dev-mondo-qtail = 0x0
fmadm faulty 명령을 실행하면 결함 관리 소프트웨어가 코어를 사용 안함으로 설정했음이 표시돼야 합니다.
faultmgmtsp> fmadm faulty ------------------- ------------------------------------ --------------- -------- Time UUID msgid Severity ------------------- ------------------------------------ --------------- -------- 2015-11-13/05:59:06 ad7bc3bf-c0d7-657b-89e2-cc68f888c312 SPSUN4V-8000-AC Critical Problem Status : open Diag Engine : fdd 1.0 System Manufacturer : Oracle Corporation Name : SPARC M7-16 Part_Number : 32863269+3+1 Serial_Number : AK00247538 ---------------------------------------- Suspect 1 of 1 Fault class : fault.cpu.generic-sparc.core-uc Certainty : 100% Affects : /SYS/CMIOU15/CM/CMP/SCC7/CORE3 Status : faulted FRU Status : faulty Location : /SYS/CMIOU15 Manufacturer : Oracle Corporation Name : CMIOU Module Part_Number : 7090830 Revision : 04 Serial_Number : 465769T+14426C01MU Chassis Manufacturer : Oracle Corporation Name : SPARC M7-16 Part_Number : 32863269+3+1 Serial_Number : AK00247538 Description : This core has encountered an uncorrectable error. Response : The fault manager will attempt to remove all strands associated with this resource from service. Impact : System performance may be affected. Action : Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/SPSUN4V-8000-AC for the latest service procedures and policies regarding this diagnosis.
임시해결책: 이 문제를 수정하려면 My Oracle Support (https://myoraclesupport.com)를 확인하십시오.
복구: Oracle ILOM 프롬프트에서 영향을 받는 호스트를 중지한 다음 시작합니다.
-> stop /Servers/PDomains/PDomain_n/HOST Are you sure you want to stop /Servers/PDomains/PDomain_n/HOST (y/n)? y -> start /Servers/PDomains/PDomain_n/HOST Are you sure you want to start /Servers/PDomains/PDomain_n/HOST (y/n)? y