Solaris OS용 Sun Cluster 시스템 관리 안내서

디스크 경로 모니터링 관리

디스크 경로 모니터링(DPM) 관리 명령을 사용하면 보조 디스크 경로 오류에 대한 알림을 받을 수 있습니다. 디스크 경로 모니터링과 관련된 관리 작업을 수행하려면 이 절의 절차를 수행하십시오. 디스크 경로 모니터링 데몬에 대한 개념 정보는 Sun Cluster Concepts Guide for Solaris OS의 3 장, Key Concepts for System Administrators and Application Developers을 참조하십시오. scdpm 명령 옵션 및 관련 명령 설명에 대한 자세한 내용은 cldevice(1CL) 매뉴얼 페이지를 참조하십시오. 데몬이 보고하는 로그 오류에 관한 자세한 내용은 syslogd(1M) 매뉴얼 페이지를 참조하십시오.


주 –

cldevice 명령을 사용하여 노드에 I/O 장치를 추가할 때 모니터된 모니터링 목록에 디스크 경로가 자동으로 추가됩니다. Sun Cluster 명령을 사용하여 노드에서 장치를 제거할 경우에도 디스크 경로가 자동으로 모니터 해제됩니다.


표 5–6 작업 맵: 디스크 경로 모니터링 관리

작업 

지침 

cldevice monitor 명령을 사용하여 디스크 경로를 모니터합니다.

디스크 경로를 모니터하는 방법

cldevice unmonitor 명령을 사용하여 디스크 경로의 모니터를 해제합니다.

디스크 경로 모니터링을 해제하는 방법

cldevice status 명령을 사용하여 노드에 대한 잘못된 디스크 경로의 상태를 인쇄합니다.

오류 디스크 경로를 인쇄하는 방법

cldevice 명령을 사용하여 파일에서 디스크 경로를 모니터합니다.

파일의 디스크 경로 모니터링 방법

모니터된 모든 디스크 경로가 실패될 때 clnode set 명령을 사용하여 노드의 자동 재부트를 활성화하거나 비활성화할 수 있습니다.

모니터된 모든 디스크 경로가 실패할 때 노드의 자동 재부트를 활성화하는 방법

모니터된 모든 디스크 경로가 실패할 때 노드의 자동 재부트를 비활성화하는 방법

잘못된 디스크 경로 상태를 확인합니다. 모니터된 DID 장치를 부트 시 사용할 수 없고 DID 인스턴스가 DID 드라이버로 업로드되지 않으면 잘못된 디스크 경로 상태가 보고될 수 있습니다.  

디스크 경로 상태 오류를 해결하는 방법

다음 절의 절차에서는 디스크 경로 인수를 포함하는 cldevice 명령을 실행합니다. 디스크 경로 인수는 노드 이름 및 디스크 이름으로 구성됩니다. 노드 이름은 필수 항목이 아니며 노드 이름을 지정하지 않은 경우 기본적으로 all로 설정됩니다.

Procedure디스크 경로를 모니터하는 방법

클러스터의 디스크 경로를 모니터하려면 이 작업을 수행하십시오.


주의 – 주의 –

DPM은 Sun Cluster 3.1 10/03 소프트웨어보다 먼저 릴리스된 버전을 실행하는 노드에서는 지원되지 않습니다. 순환 업그레이드가 진행되는 동안에는 DPM 명령을 사용하지 마십시오. 모든 노드를 업그레이드한 후 DPM 명령을 사용하려면 노드가 온라인 상태여야 합니다.


이 절차에서는 장문형 Sun Cluster 명령을 제공합니다. 대부분의 명령에는 단문형도 있습니다. 명령은 명령 이름이 장문형과 단문형인 것을 제외하면 동일합니다. 명령 및 단문형 명령의 목록을 보려면 부록 A, Sun Cluster 객체 지향 명령를 참조하십시오.

  1. 클러스터의 아무 노드에서나 수퍼유저 또는 solaris.cluster.modify RBAC 인증을 제공하는 역할로 전환합니다.

  2. 디스크 경로를 모니터합니다.


    # cldevice monitor -n node disk
    
  3. 디스크 경로가 모니터되는지 확인합니다.


    # cldevice status device
    

예 5–44 단일 노드의 디스크 경로 모니터링

다음 예에서는 단일 노드의 schost-1:/dev/did/rdsk/d1 디스크 경로를 모니터합니다. schost-1 노드의 DPM 데몬에서만 /dev/did/dsk/d1 디스크에 대한 경로를 모니터합니다.


# cldevice monitor -n schost-1 /dev/did/dsk/d1
# cldevice status d1

Device Instance   Node           Status
--------------- ---- ------
/dev/did/rdsk/d1   phys-schost-1 Ok


예 5–45 모든 노드의 디스크 경로 모니터링

다음 예에서는 모든 노드의 schost-1:/dev/did/dsk/d1 디스크 경로를 모니터합니다. /dev/did/dsk/d1이 유효한 경로인 모든 노드에서 DPM이 시작됩니다.


# cldevice monitor /dev/did/dsk/d1
# cldevice status /dev/did/dsk/d1

Device Instance   Node           Status
--------------- ---- ------
/dev/did/rdsk/d1   phys-schost-1 Ok


예 5–46 CCR의 디스크 구성 다시 읽기

다음 예에서는 데몬이 CCR의 디스크 구성을 다시 읽어서 모니터된 디스크 경로를 상태와 함께 인쇄합니다.


# cldevice monitor +
# cldevice status
Device Instance              Node               Status
---------------              ----               ------
/dev/did/rdsk/d1             schost-1           Ok
/dev/did/rdsk/d2             schost-1           Ok
/dev/did/rdsk/d3             schost-1           Ok
                              schost-2          Ok
/dev/did/rdsk/d4             schost-1           Ok
                              schost-2          Ok
/dev/did/rdsk/d5             schost-1           Ok
                              schost-2          Ok
/dev/did/rdsk/d6             schost-1           Ok
                              schost-2          Ok
/dev/did/rdsk/d7             schost-2           Ok
/dev/did/rdsk/d8             schost-2           Ok

Procedure디스크 경로 모니터링을 해제하는 방법

디스크 경로의 모니터를 해제하려면 다음 절차를 수행합니다.


주의 – 주의 –

DPM은 Sun Cluster 3.1 10/03 소프트웨어보다 먼저 릴리스된 버전을 실행하는 노드에서는 지원되지 않습니다. 순환 업그레이드가 진행되는 동안에는 DPM 명령을 사용하지 마십시오. 모든 노드를 업그레이드한 후 DPM 명령을 사용하려면 노드가 온라인 상태여야 합니다.


이 절차에서는 장문형 Sun Cluster 명령을 제공합니다. 대부분의 명령에는 단문형도 있습니다. 명령은 명령 이름이 장문형과 단문형인 것을 제외하면 동일합니다. 명령 및 단문형 명령의 목록을 보려면 부록 A, Sun Cluster 객체 지향 명령를 참조하십시오.

  1. 클러스터의 아무 노드에서나 수퍼유저 또는 solaris.cluster.modify RBAC 인증을 제공하는 역할로 전환합니다.

  2. 모니터링을 해제할 디스크 경로의 상태를 확인합니다.


    # cldevice status device
    
  3. 각 노드에서 해당하는 디스크 경로의 모니터링을 해제합니다.


    # cldevice unmonitor -n node disk
    

예 5–47 디스크 경로 모니터링 취소

다음 예에서는 schost-2:/dev/did/rdsk/d1 디스크 경로에 대한 모니터링을 해제하고 디스크 경로를 전체 클러스터 상태와 함께 인쇄합니다.


# cldevice unmonitor -n schost2 /dev/did/rdsk/d1
# cldevice status -n schost2 /dev/did/rdsk/d1

Device Instance              Node               Status
---------------              ----               ------
/dev/did/rdsk/d1             schost-2           Unmonitored

Procedure오류 디스크 경로를 인쇄하는 방법

클러스터의 오류 디스크 경로를 인쇄하려면 다음 절차를 사용하십시오.


주의 – 주의 –

DPM은 Sun Cluster 3.1 10/03 소프트웨어보다 먼저 릴리스된 버전을 실행하는 노드에서는 지원되지 않습니다. 순환 업그레이드가 진행되는 동안에는 DPM 명령을 사용하지 마십시오. 모든 노드를 업그레이드한 후 DPM 명령을 사용하려면 노드가 온라인 상태여야 합니다.


  1. 임의의 클러스터의 노드에서 수퍼유저로 전환합니다.

  2. 클러스터에서 오류가 발생한 디스크 경로를 인쇄합니다.


    # cldevice status -s fail
    

예 5–48 오류 디스크 경로 인쇄

다음 예에서는 전체 클러스터에서 오류가 발생한 디스크 경로를 인쇄합니다.


# cldevice status -s fail
     
Device Instance               Node              Status
---------------               ----              ------
dev/did/dsk/d4                phys-schost-1     fail

Procedure디스크 경로 상태 오류를 해결하는 방법

다음 이벤트가 발생하는 경우 DPM이 온라인 상태로 전환되면 오류가 있는 경로의 상태가 업데이트되지 않을 수 있습니다.

모니터된 DID 장치를 부트 시 사용할 수 없고 따라서 DID 인스턴스가 DID 드라이버로 업로드되지 않으므로 잘못된 디스크 경로 상태가 보고됩니다. 이 상황이 발생하면 DID 정보를 수동으로 업데이트해야 합니다.

  1. 한 노드에서 전역 장치 이름 공간을 업데이트합니다.


    # cldevice populate
    
  2. 각 노드에서 다음 단계로 진행하기 전에 명령 처리가 완료되었는지 확인합니다.

    이 명령이 하나의 노드에서 실행되더라도 모든 노드에서 원격으로 실행됩니다. 명령 처리가 완료되었는지 확인하려면 클러스터의 각 노드에서 다음 명령을 실행합니다.


    # ps -ef | grep scgdevs
    
  3. DPM 폴링 시간 프레임 내에서 오류가 있는 디스크 경로 상태가 이제 정상인지 확인합니다.


    # cldevice status disk-device
    
    Device Instance               Node                  Status
    ---------------               ----                  ------
    dev/did/dsk/dN                phys-schost-1         Ok

Procedure파일의 디스크 경로 모니터링 방법

파일의 디스크 경로를 모니터링 또는 모니터링 해제하려면 다음 절차를 수행하십시오.

파일을 사용하여 클러스터 구성을 변경하려면 맨 먼저 현재 구성을 내보내야 합니다. 이 내보내기 작업에서는 변경할 구성 항목을 설정하기 위해 수정할 수 있는 XML 파일을 만듭니다. 이 절차의 지침은 전체 프로세스를 설명합니다.


주의 – 주의 –

DPM은 Sun Cluster 3.1 10/03 소프트웨어보다 먼저 릴리스된 버전을 실행하는 노드에서는 지원되지 않습니다. 순환 업그레이드가 진행되는 동안에는 DPM 명령을 사용하지 마십시오. 모든 노드를 업그레이드한 후 DPM 명령을 사용하려면 노드가 온라인 상태여야 합니다.


이 절차에서는 장문형 Sun Cluster 명령을 제공합니다. 대부분의 명령에는 단문형도 있습니다. 명령은 명령 이름이 장문형과 단문형인 것을 제외하면 동일합니다. 명령 및 단문형 명령의 목록을 보려면 부록 A, Sun Cluster 객체 지향 명령를 참조하십시오.

  1. 클러스터의 아무 노드에서나 수퍼유저 또는 solaris.cluster.modify RBAC 인증을 제공하는 역할로 전환합니다.

  2. 장치 구성을 XML 파일로 내보냅니다.


    # cldevice export -o configurationfile
    
    -o configurationfile

    XML 파일의 파일 이름을 지정합니다.

  3. 구성 파일을 수정하여 장치 경로를 모니터합니다.

    모니터할 장치 경로를 찾고 monitored 속성을 true로 설정합니다.

  4. 장치 경로를 모니터합니다.


    # cldevice monitor -i configurationfile
    
    -i configurationfile

    수정된 XML 파일의 이름을 지정합니다.

  5. 이제 장치 경로가 모니터되는지 확인합니다.


    # cldevice status
    

예 5–49 파일을 사용한 디스크 경로 모니터

다음은 노드 phys-schost–2 및 장치 d3 사이의 장치 경로를 XML 파일을 사용하여 모니터하는 예입니다.

맨 처음 현재 클러스터 구성을 내보냅니다.


# cldevice export -o deviceconfig

deviceconfig XML 파일은 phys-schost–2d3 간의 경로가 현재 모니터되고 있지 않음을 나타냅니다.


<?xml version="1.0"?>
<!DOCTYPE cluster SYSTEM "/usr/cluster/lib/xml/cluster.dtd">
<cluster name="brave_clus">
.
.
.
   <deviceList readonly="true">
    <device name="d3" ctd="c1t8d0">
      <devicePath nodeRef="phys-schost-1" monitored="true"/>
      <devicePath nodeRef="phys-schost-2" monitored="false"/>
    </device>
  </deviceList>
</cluster>

경로를 모니터 하려면 다음과 같이 monitored 속성을 true로 설정합니다.


<?xml version="1.0"?>
<!DOCTYPE cluster SYSTEM "/usr/cluster/lib/xml/cluster.dtd">
<cluster name="brave_clus">
.
.
.
   <deviceList readonly="true">
    <device name="d3" ctd="c1t8d0">
      <devicePath nodeRef="phys-schost-1" monitored="true"/>
      <devicePath nodeRef="phys-schost-2" monitored="true"/>
    </device>
  </deviceList>
</cluster>

파일을 읽고 모니터링을 시작하려면 cldevice 명령을 사용합니다.


# cldevice monitor -i deviceconfig

장치가 지금 모니터되고 있는지 확인하려면 cldevice 명령을 사용합니다.


# cldevice status

참조

클러스터 구성 내보내기 및 XML 파일 결과를 클러스터 구성 설정에 사용하는 데 대한 자세한 내용은 cluster(1CL)clconfiguration(5CL) 매뉴얼 페이지를 참조하십시오.

Procedure모니터된 모든 디스크 경로가 실패할 때 노드의 자동 재부트를 활성화하는 방법

이 기능을 활성화한 상태에서는 다음 조건이 충족될 경우 노드가 자동으로 재부트됩니다.

노드를 재부트하면 해당 노드에서 마스터되는 모든 자원 그룹 및 장치 그룹이 다른 노드에서 재시작됩니다.

노드가 자동으로 재부트된 후 노드의 모든 모니터된 디스크 경로가 액세스할 수 없는 상태로 된 경우, 노드는 다시 자동으로 재부트되지 않습니다. 그러나, 노드가 재부트된 후 디스크 경로가 사용 가능한 상태로 되었다가 실패한 경우 노드가 다시 자동으로 재부트됩니다.

  1. 클러스터의 아무 노드에서나 수퍼유저 또는 solaris.cluster.modify RBAC 인증을 제공하는 역할로 전환합니다.

  2. 클러스터의 모든 노드는 모니터된 모든 디스크가 실패할 때 노드를 자동으로 재부트합니다.


    # clnode set -p reboot_on_path_failure=enabled +
    

Procedure모니터된 모든 디스크 경로가 실패할 때 노드의 자동 재부트를 비활성화하는 방법

자동 재부트를 비활성화한 상태에서 노드의 모니터된 모든 디스크 경로가 실패하면 노드가 자동으로 재부트되지 않습니다.

  1. 클러스터의 아무 노드에서나 수퍼유저 또는 solaris.cluster.modify RBAC 인증을 제공하는 역할로 전환합니다.

  2. 클러스터의 모든 노드에 대해, 모니터된 모든 디스크 경로가 실패할 경우 자동 재부트를 비활성화합니다.


    # clnode set -p reboot_on_path_failure=disabled +