Sun Cluster Geographic Edition 시스템 관리 설명서

부록 D Sun Cluster Geographic Edition 소프트웨어 문제 해결

이 부록에서는 Sun Cluster Geographic Edition 소프트웨어의 응용 프로그램 문제 해결에 대한 절차를 설명합니다.

이 부록의 내용은 다음과 같습니다.

모니터링 및 로깅 문제 해결

이 절은 로깅 설정 및 Sun Cluster Geographic Edition 소프트웨어 모니터링 시 나타날 수 있는 문제점에 대한 정보를 제공합니다.

지나치게 많은 추적을 피하기 위한 로거 파일 구성

기록할 메시지에 따라 다음과 같이 로거 파일 /etc/opt/SUNWcacao/logger.properties가 구성됩니다.

활성화된 추적이 /var/opt/SUNWcacao/logs/cacao.0 파일에 복사됩니다.

gcr 에이전트에서 상세 메시지를 피하기 위한 로그 파일 구성

gcr 에이전트의 로그 파일에서 지나치게 자세한 상세 메시지를 피하려면 로거 파일 /etc/opt/SUNWcacao/logger.properties에서 다음과 유사한 항목을 사용합니다.


com.sun.cluster.level=WARNING
com.sun.cluster.agent.geocontrol.gcr.level=INFO
com.sun.cluster.agent.geocontrol.level=ALL

이 등록 정보 파일은 SUNWscmasa 패키지를 다시 설치할 때마다 업데이트됩니다.

jmx 원격 추적을 피하기 위한 로그 파일 구성

jmx 원격 추적을 피하려면 다음의 줄을 logger.properties 파일 시작 부분에 추가합니다.


javax.management.remote.level=OFF
com.sun.jmx.remote.level=OFF
java.io.level=OFF

마이그레이션 문제 해결

이 절은 Sun Cluster Geographic Edition 소프트웨어를 사용하여 서비스가 마이그레이션될 때 발생할 수 있는 문제점에 대한 정보를 제공합니다.

저장 장치와의 통신이 두절될 때 응용 프로그램 자원 그룹의 장애 복구로 문제 해결

온라인 상태인 응용 프로그램이 있는 노드와 저장 장치 사이의 통신이 두절되는 경우, 일부 응용 프로그램 자원 그룹은 액세스 가능한 저장소에서 노드로 안전하게 장애 조치하지 못할 수 있습니다. 응용 프로그램 자원 그룹은 ERROR_STOP_FAILED 상태가 될 수 있습니다.

해결 방법

Sun Cluster 기본 구조는 볼륨 또는 해당 기본 장치에서 I/O 오류가 발생할 때 전환을 시작하지 않습니다. 전환 또는 장애 복구가 발생하지 않으므로 저장소가 액세스할 수 없게 되더라도 시스템 노드에서 온라인 상태를 유지합니다.

이 문제가 발생하면 표준 Sun Cluster 절차를 따라 올바른 노드에서 응용 프로그램 자원 그룹을 재시작합니다. ERROR_STOP_FAILED 상태에서 복구 및 응용 프로그램 재시작에 대한 자세한 내용은 Sun Cluster Data Services Planning and Administration Guide for Solaris OSClearing the STOP_FAILED Error Flag on Resources를 참조하십시오.

Sun Cluster Geographic Edition 소프트웨어는 응용 프로그램 자원 그룹의 상태 변경을 감지하고 geoadm status 명령 출력 시 상태를 표시합니다. 이 명령의 사용에 대한 자세한 내용은 Sun Cluster Geographic Edition 소프트웨어 런타임 상태 모니터링 을 참조하십시오.

클러스터 시작 및 재시작 문제 해결

이 절은 Sun Cluster Geographic Edition 소프트웨어 시작 및 재시작 시 나타날 수 있는 문제의 해결 방안에 대한 정보를 제공합니다.

오류 상태인 보호 그룹 검증

클러스터가 보호 그룹을 재부트한 후 그룹 구성이 오류 상태가 될 수 있습니다. 이 문제는 보호 그룹이 재부트한 후 초기화될 때 공통 에이전트 컨테이너를 클러스터의 한 노드에서 사용할 수 없어서 발생합니다.

해결 방법

구성 오류를 수정하려면 오류 상태인 보호 그룹에서 geopg validate 명령을 사용합니다.

공통 에이전트 컨테이너 재시작

Sun Cluster 소프트웨어는 Sun Cluster 소프트웨어 설치 동안에만 공통 에이전트 컨테이너를 활성화합니다. 따라서, 설치 후 언제라도 공통 에이전트 컨테이너를 비활성화하는 경우 공통 에이전트 컨테이너는 비활성 상태를 유지합니다.

해결 방법

노드를 재부트한 후 공통 에이전트 컨테이너를 활성화하려면 /opt/SUNWcacao/bin/cacaoadm enable 명령을 사용합니다.