탐색 링크 건너뛰기 | |
인쇄 보기 종료 | |
Oracle Solaris 11.1에서 서비스 및 결함 관리 Oracle Solaris 11.1 Information Library (한국어) |
고장 또는 결함 정보를 표시하고 관련된 FRU를 확인하기 위해 일반적으로 사용되는 방법은 fmadm faulty 명령입니다. 그러나 fmdump 명령도 지원됩니다. 대개 fmdump는 시스템 문제에 대한 기록 로그를 표시하는 데 사용되고 fmadm faulty는 현재 문제를 표시하는 데 사용됩니다.
주의 - fmadm faulty 출력이 아니라 fmdump 명령의 출력에 기준하여 관리 작업을 수행하지 마십시오. 로그 파일에는 고장 또는 결함으로 간주해서는 안되는 오류 설명이 포함될 수 있습니다. |
자세한 내용은 Oracle Solaris 11.1 관리: 보안 서비스의 지정된 관리 권한을 사용하는 방법을 참조하십시오.
# fmadm faulty
생성된 텍스트에 대한 설명은 다음 예를 참조하십시오.
예 3-1 결함이 있는 하나의 CPU가 포함된 fmadm 출력
1 # fmadm faulty 2 --------------- ------------------------------------ -------------- --------- 3 TIME EVENT-ID MSG-ID SEVERITY 4 --------------- ------------------------------------ -------------- --------- 5 Aug 24 17:56:03 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 SUN4V-8001-8H Minor 6 7 Host : bur419-61 8 Platform : SUNW,T5440 Chassis_id : BEL07524BN 9 Product_sn : BEL07524BN 10 11 Fault class : fault.cpu.ultraSPARC-T2plus.ireg 12 Affects : cpu:///cpuid=0/serial=1F95806CD1421929 13 faulted and taken out of service 14 FRU : "MB/CPU0" (hc://:product-id=SUNW,T5440:server-id=bur419-61:\ 15 serial=3529:part=541255304/motherboard=0/cpuboard=0) 16 faulty 17 Serial ID. : 3529 18 1F95806CD1421929 19 20 Description : The number of integer register errors associated with this thread 21 has exceeded acceptable levels. 22 23 Response : The fault manager will attempt to remove the affected thread from 24 service. 25 26 Impact : System performance may be affected. 27 28 Action : Use 'fmadm faulty' to provide a more detailed view of this event. 29 Please refer to the associated reference document at 30 http://support.oracle.com/msg/SUN4V-8001-8H for the latest service 31 procedures and policies regarding this diagnosis.
주의해야 할 부분은 영향을 받은 FRU에 대한 데이터를 표시하는 14행입니다. 사람이 읽을 수 있는 위치 문자열이 따옴표로 묶여 있는 "MB/CPU0"에서 제공됩니다. 따옴표로 묶인 값은 물리적 하드웨어의 레이블과 일치합니다. 또한 FRU는 FMRI(Fault Management Resource Identifier) 형식으로 표현됩니다. 이 형식에는 결함이 있는 시스템에 대한 설명적인 등록 정보(예: 호스트 이름 및 섀시 일련 번호)가 포함됩니다. 지원되는 플랫폼에서는 FRU의 부품 번호 및 일련 번호도 FRU의 FMRI에 포함됩니다.
Affects 행(12행 및 13행)은 결함 및 결함의 상대적인 상태로 인해 영향을 받은 구성 요소를 나타냅니다. 이 예에서는 단일 CPU 스트랜드가 영향을 받습니다. faulted and taken out of service로 표시되어 있습니다.
fmadm faulty 명령 출력에서 FRU 설명 뒤에 오는 16행에는 상태가 faulty로 표시됩니다. 또한 Action 섹션에는 fmadm 명령에 대한 일반적인 참조 대신에 또는 이러한 참조 외에도 다른 특정 작업이 포함될 수 있습니다.
예 3-2 여러 결함이 있는 fmadm 출력
1 # fmadm faulty 2 --------------- ------------------------------------ -------------- ------- 3 TIME EVENT-ID MSG-ID SEVERITY 4 --------------- ------------------------------------ -------------- ------- 5 Sep 21 10:01:36 d482f935-5c8f-e9ab-9f25-d0aaafec1e6c PCIEX-8000-5Y Major 6 7 Fault class : fault.io.pci.device-invreq 8 Affects : dev:///pci@0,0/pci1022,7458@11/pci1000,3060@0 9 dev:///pci@0,0/pci1022,7458@11/pci1000,3060@1 10 ok and in service 11 dev:///pci@0,0/pci1022,7458@11/pci1000,3060@2 12 dev:///pci@0,0/pci1022,7458@11/pci1000,3060@3 13 faulty and taken out of service 14 FRU : "SLOT 2" (hc://.../pciexrc=3/pciexbus=4/pciexdev=0) 15 repair attempted 16 "SLOT 3" (hc://.../pciexrc=3/pciexbus=4/pciexdev=1) 17 acquitted 18 "SLOT 4" (hc://.../pciexrc=3/pciexbus=4/pciexdev=2) 19 not present 20 "SLOT 5" (hc://.../pciexrc=3/pciexbus=4/pciexdev=3) 21 faulty 22 23 Description : The transmitting device sent an invalid request. 24 25 Response : One or more device instances may be disabled 26 27 Impact : Possible loss of services provided by the device instances 28 associated with this fault 29 30 Action : Use 'fmadm faulty' to provide a more detailed view of this event. 31 Please refer to the associated reference document at 32 http://support.oracle.com/msg/PCIEX-8000-5Y for the latest service 33 procedures and policies regarding this diagnosis.
fmadm faulty 명령 출력에서 FRU 설명 뒤에 오는 21행에는 상태가 faulty로 표시됩니다. 다른 상황에서 표시될 수 있는 다른 상태 값으로는 15행 및 17행에서 SLOT 2 및 SLOT 3에 대해 표시된 acquitted 및 repair attempted가 있습니다.
예 3-3 fmdump 명령을 사용하여 결함 표시
일부 콘솔 메시지 및 기술 자료 문서에는 이전 fmdump -v -u UUID 명령을 사용하여 결함 정보를 표시하도록 되어 있을 수 있습니다. fmadm faulty 명령이 일반적으로 사용되지만 다음 예와 같이 fmdump 명령도 계속 작동합니다.
1 % fmdump -v -u 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 2 TIME UUID SUNW-MSG-ID EVENT 3 Aug 24 17:56:03.4596 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 SUN4V-8001-8H Diagnosed 4 100% fault.cpu.ultraSPARC-T2plus.ireg 5 6 Problem in: - 7 Affects: cpu:///cpuid=0/serial=1F95806CD1421929 8 FRU: hc://:product-id=SUNW,T5440:server-id=bur419-61:\ 9 serial=9999:part=541255304/motherboard=0/cpuboard=0 10 Location: MB/CPU0
세 개의 행(8행 - 10행)으로 구분되어 있긴 해도 영향을 받은 FRU에 대한 정보가 여전히 제공됩니다. Location 문자열은 사람이 읽을 수 있는 FRU 문자열을 제공합니다. FRU 행은 정식 FMRI를 제공합니다. fmdump 명령에서 -m 옵션을 사용하지 않을 경우 심각도, 설명 텍스트 및 작업이 표시되지 않습니다. 자세한 내용은 fmdump(1M) 매뉴얼 페이지를 참조하십시오.
% /usr/sbin/psrinfo 0 faulted since 05/13/2011 12:55:26 1 on-line since 05/12/2011 11:47:26
faulted 상태는 Fault Management 응답 에이전트가 CPU를 오프라인 상태로 전환했음을 나타냅니다.
자세한 내용은 Oracle Solaris 11.1 관리: 보안 서비스의 지정된 관리 권한을 사용하는 방법을 참조하십시오.
# fmadm faulty --------------- ------------------------------------ -------------- --------- TIME EVENT-ID MSG-ID SEVERITY --------------- ------------------------------------ -------------- --------- May 12 22:52:47 915cb64b-e16b-4f49-efe6-de81ff96fce7 SMF-8000-YX major Host : parity Platform : Sun-Fire-V40z Chassis_id : XG051535088 Product_sn : XG051535088 Fault class : defect.sunos.smf.svc.maintenance Affects : svc:///system/intrd:default faulted and taken out of service Problem in : svc:///system/intrd:default faulted and taken out of service Description : A service failed - it is restarting too quickly. Response : The service has been placed into the maintenance state. Impact : svc:/system/intrd:default is unavailable. Action : Run 'svcs -xv svc:/system/intrd:default' to determine the generic reason why the service failed, the location of any logfiles, and a list of other services impacted. Please refer to the associated reference document at http://support.oracle.com/msg/SMF-8000-YX for the latest service procedures and policies regarding this diagnosis.
fmadm 출력의 Action 섹션에 제공된 지침을 따릅니다.
# svcs -xv svc:/system/intrd:default svc:/system/intrd:default (interrupt balancer) State: maintenance since Wed May 12 22:52:47 2010 Reason: Restarting too quickly. See: http://support.oracle.com/msg/SMF-8000-YX See: man -M /usr/share/man -s 1M intrd See: /var/svc/log/system-intrd:default.log Impact: This service is not running.
이 문제를 해결하는 방법에 대한 추가 지침은 기술 자료 문서 SMF-8000-YX를 참조하십시오.