JavaScript is required to for searching.
탐색 링크 건너뛰기
인쇄 보기 종료
Oracle Solaris 11.1에서 서비스 및 결함 관리     Oracle Solaris 11.1 Information Library (한국어)
search filter icon
search icon

문서 정보

머리말

1.  서비스 관리(개요)

2.  서비스 관리(작업)

3.  Fault Manager 사용

Fault Management 개요

고장과 결함 알림

고장 또는 결함에 대한 정보 표시

결함이 있는 구성 요소에 대한 정보를 표시하는 방법

오프라인 상태인 CPU를 식별하는 방법

결함 있는 서비스에 대한 정보를 표시하는 방법

고장 또는 결함 복구

fmadm replaced 명령

fmadm repaired 명령

fmadm acquit 명령

Fault Management 로그 파일

결함 통계

색인

고장 또는 결함에 대한 정보 표시

고장 또는 결함 정보를 표시하고 관련된 FRU를 확인하기 위해 일반적으로 사용되는 방법은 fmadm faulty 명령입니다. 그러나 fmdump 명령도 지원됩니다. 대개 fmdump는 시스템 문제에 대한 기록 로그를 표시하는 데 사용되고 fmadm faulty는 현재 문제를 표시하는 데 사용됩니다.


주의

주의 - fmadm faulty 출력이 아니라 fmdump 명령의 출력에 기준하여 관리 작업을 수행하지 마십시오. 로그 파일에는 고장 또는 결함으로 간주해서는 안되는 오류 설명이 포함될 수 있습니다.


결함이 있는 구성 요소에 대한 정보를 표시하는 방법

  1. 관리자로 전환합니다.

    자세한 내용은 Oracle Solaris 11.1 관리: 보안 서비스의 지정된 관리 권한을 사용하는 방법을 참조하십시오.

  2. 구성 요소에 대한 정보를 표시합니다.
    # fmadm faulty

    생성된 텍스트에 대한 설명은 다음 예를 참조하십시오.

예 3-1 결함이 있는 하나의 CPU가 포함된 fmadm 출력

1    # fmadm faulty
2    --------------- ------------------------------------  -------------- ---------
3    TIME            EVENT-ID                              MSG-ID         SEVERITY
4    --------------- ------------------------------------  -------------- ---------
5    Aug 24 17:56:03 7b83c87c-78f6-6a8e-fa2b-d0cf16834049  SUN4V-8001-8H  Minor
6    
7    Host        : bur419-61
8    Platform    : SUNW,T5440        Chassis_id  : BEL07524BN
9    Product_sn  : BEL07524BN
10
11   Fault class : fault.cpu.ultraSPARC-T2plus.ireg
12   Affects     : cpu:///cpuid=0/serial=1F95806CD1421929
13                     faulted and taken out of service
14   FRU         : "MB/CPU0" (hc://:product-id=SUNW,T5440:server-id=bur419-61:\
15                 serial=3529:part=541255304/motherboard=0/cpuboard=0)
16                     faulty
17   Serial ID.  : 3529
18                 1F95806CD1421929
19   
20   Description : The number of integer register errors associated with this thread
21                 has exceeded acceptable levels.
22   
23   Response    : The fault manager will attempt to remove the affected thread from
24                 service.
25   
26   Impact      : System performance may be affected.
27   
28   Action      : Use 'fmadm faulty' to provide a more detailed view of this event.
29                 Please refer to the associated reference document at
30                 http://support.oracle.com/msg/SUN4V-8001-8H for the latest service
31                 procedures and policies regarding this diagnosis.
 

주의해야 할 부분은 영향을 받은 FRU에 대한 데이터를 표시하는 14행입니다. 사람이 읽을 수 있는 위치 문자열이 따옴표로 묶여 있는 "MB/CPU0"에서 제공됩니다. 따옴표로 묶인 값은 물리적 하드웨어의 레이블과 일치합니다. 또한 FRU는 FMRI(Fault Management Resource Identifier) 형식으로 표현됩니다. 이 형식에는 결함이 있는 시스템에 대한 설명적인 등록 정보(예: 호스트 이름 및 섀시 일련 번호)가 포함됩니다. 지원되는 플랫폼에서는 FRU의 부품 번호 및 일련 번호도 FRU의 FMRI에 포함됩니다.

Affects 행(12행 및 13행)은 결함 및 결함의 상대적인 상태로 인해 영향을 받은 구성 요소를 나타냅니다. 이 예에서는 단일 CPU 스트랜드가 영향을 받습니다. faulted and taken out of service로 표시되어 있습니다.

fmadm faulty 명령 출력에서 FRU 설명 뒤에 오는 16행에는 상태가 faulty로 표시됩니다. 또한 Action 섹션에는 fmadm 명령에 대한 일반적인 참조 대신에 또는 이러한 참조 외에도 다른 특정 작업이 포함될 수 있습니다.

예 3-2 여러 결함이 있는 fmadm 출력

1    # fmadm faulty
2    --------------- ------------------------------------  -------------- -------
3    TIME            EVENT-ID                              MSG-ID         SEVERITY
4    --------------- ------------------------------------  -------------- -------
5    Sep 21 10:01:36 d482f935-5c8f-e9ab-9f25-d0aaafec1e6c  PCIEX-8000-5Y  Major
6    
7    Fault class  : fault.io.pci.device-invreq
8    Affects      : dev:///pci@0,0/pci1022,7458@11/pci1000,3060@0
9                   dev:///pci@0,0/pci1022,7458@11/pci1000,3060@1
10                   ok and in service
11                  dev:///pci@0,0/pci1022,7458@11/pci1000,3060@2
12                  dev:///pci@0,0/pci1022,7458@11/pci1000,3060@3
13                    faulty and taken out of service
14   FRU          : "SLOT 2" (hc://.../pciexrc=3/pciexbus=4/pciexdev=0)
15                    repair attempted
16                  "SLOT 3" (hc://.../pciexrc=3/pciexbus=4/pciexdev=1)
17                    acquitted
18                  "SLOT 4" (hc://.../pciexrc=3/pciexbus=4/pciexdev=2)
19                    not present
20                  "SLOT 5" (hc://.../pciexrc=3/pciexbus=4/pciexdev=3)
21                    faulty
22   
23    Description  : The transmitting device sent an invalid request.
24   
25    Response     : One or more device instances may be disabled
26   
27    Impact       : Possible loss of services provided by the device instances
28                   associated with this fault
29   
30    Action       : Use 'fmadm faulty' to provide a more detailed view of this event.
31                   Please refer to the associated reference document at
32                   http://support.oracle.com/msg/PCIEX-8000-5Y for the latest service
33                   procedures and policies regarding this diagnosis.

fmadm faulty 명령 출력에서 FRU 설명 뒤에 오는 21행에는 상태가 faulty로 표시됩니다. 다른 상황에서 표시될 수 있는 다른 상태 값으로는 15행 및 17행에서 SLOT 2SLOT 3에 대해 표시된 acquittedrepair attempted가 있습니다.

예 3-3 fmdump 명령을 사용하여 결함 표시

일부 콘솔 메시지 및 기술 자료 문서에는 이전 fmdump -v -u UUID 명령을 사용하여 결함 정보를 표시하도록 되어 있을 수 있습니다. fmadm faulty 명령이 일반적으로 사용되지만 다음 예와 같이 fmdump 명령도 계속 작동합니다.

1    % fmdump -v -u 7b83c87c-78f6-6a8e-fa2b-d0cf16834049
2    TIME                 UUID                                 SUNW-MSG-ID EVENT
3    Aug 24 17:56:03.4596 7b83c87c-78f6-6a8e-fa2b-d0cf16834049 SUN4V-8001-8H Diagnosed
4      100%  fault.cpu.ultraSPARC-T2plus.ireg
5
6            Problem in: -
7               Affects: cpu:///cpuid=0/serial=1F95806CD1421929
8                   FRU: hc://:product-id=SUNW,T5440:server-id=bur419-61:\
9                   serial=9999:part=541255304/motherboard=0/cpuboard=0
10              Location: MB/CPU0

세 개의 행(8행 - 10행)으로 구분되어 있긴 해도 영향을 받은 FRU에 대한 정보가 여전히 제공됩니다. Location 문자열은 사람이 읽을 수 있는 FRU 문자열을 제공합니다. FRU 행은 정식 FMRI를 제공합니다. fmdump 명령에서 -m 옵션을 사용하지 않을 경우 심각도, 설명 텍스트 및 작업이 표시되지 않습니다. 자세한 내용은 fmdump(1M) 매뉴얼 페이지를 참조하십시오.

오프라인 상태인 CPU를 식별하는 방법

결함 있는 서비스에 대한 정보를 표시하는 방법

  1. 관리자로 전환합니다.

    자세한 내용은 Oracle Solaris 11.1 관리: 보안 서비스의 지정된 관리 권한을 사용하는 방법을 참조하십시오.

  2. 결함에 대한 정보를 표시합니다.
    # fmadm faulty
    --------------- ------------------------------------  -------------- ---------
    TIME            EVENT-ID                              MSG-ID         SEVERITY
    --------------- ------------------------------------  -------------- ---------
    May 12 22:52:47 915cb64b-e16b-4f49-efe6-de81ff96fce7  SMF-8000-YX    major
    
    Host        : parity
    Platform    : Sun-Fire-V40z     Chassis_id  : XG051535088
    Product_sn  : XG051535088
    
    Fault class : defect.sunos.smf.svc.maintenance
    Affects     : svc:///system/intrd:default
                      faulted and taken out of service
    Problem in  : svc:///system/intrd:default
                      faulted and taken out of service
    
    Description : A service failed - it is restarting too quickly.
    
    Response    : The service has been placed into the maintenance state.
    
    Impact      : svc:/system/intrd:default is unavailable.
    
    Action      : Run 'svcs -xv svc:/system/intrd:default' to determine the
                  generic reason why the service failed, the location of any
                  logfiles, and a list of other services impacted. Please refer to
                  the associated reference document at
                  http://support.oracle.com/msg/SMF-8000-YX for the latest service procedures
                  and policies regarding this diagnosis.
  3. 결함 있는 서비스에 대한 정보를 표시합니다.

    fmadm 출력의 Action 섹션에 제공된 지침을 따릅니다.

    # svcs -xv svc:/system/intrd:default
    svc:/system/intrd:default (interrupt balancer)
     State: maintenance since Wed May 12 22:52:47 2010
    Reason: Restarting too quickly.
       See: http://support.oracle.com/msg/SMF-8000-YX
       See: man -M /usr/share/man -s 1M intrd
       See: /var/svc/log/system-intrd:default.log
    Impact: This service is not running.

    이 문제를 해결하는 방법에 대한 추가 지침은 기술 자료 문서 SMF-8000-YX를 참조하십시오.