Solaris OS용 Sun Java System Application Server에 대한 Sun Cluster 데이터 서비스 안내서

Sun Cluster HA for Sun Java System Application Server의 오류 모니터 조정

Sun Cluster HA for Sun Java System Application Server(8.1 버전 지원)의 DAS(Domain Administration Server) 구성 요소에 대한 오류 모니터는 자원 유형이 SUNW.jsas인 자원에 있습니다.

자원 유형의 시스템 등록 정보와 확장 등록 정보는 오류 모니터의 동작을 제어합니다. 이 등록 정보의 기본값은 오류 모니터의 미리 설정된 동작을 결정합니다. 미리 설정된 동작은 대부분의 Sun Cluster 설치에 적합해야 합니다. 따라서 미리 설정된 동작을 수정해야 하는 경우에만 오류 모니터를 조정해야 합니다.

오류 모니터 조정에는 다음의 작업이 포함됩니다.

Sun Cluster HA for Sun Java System Application Server를 등록하고 구성하는 작업은 Sun Cluster HA for Sun Java System Application Server(8.1 버전 지원) 등록 및 구성에 설명된 대로 수행합니다.

이 작업에 대한 자세한 내용은 Sun Cluster Data Services Planning and Administration Guide for Solaris OSTuning Fault Monitors for Sun Cluster Data Services를 참조하십시오.

이 절에서는 다음 내용을 설명합니다.

검사 중 DAS 구성 요소에 대해 오류 모니터가 수행하는 작업

Sun Cluster HA for Sun Java System Application Server의 DAS 구성 요소에 대한 오류 모니터 검사에서는 Sun Java System Application Server 서버 상태를 쿼리하도록 서버로 요청을 보냅니다. 오류 모니터의 작업은 Monitor_Uri_List 확장 등록 정보의 설정에 따라 달라집니다.

Monitor_Uri_List 등록 정보가 설정된 경우 오류 모니터 작업

Monitor_Uri_List 확장 등록 정보가 단일 URI 또는 URI 목록으로 설정되면 오류 모니터 검사에서 다음 단계를 실행합니다.

  1. 오류 모니터는 Probe_timeout 자원 등록 정보에 설정된 시간 초과 값에 따라 Sun Java System Application Server 인스턴스를 검사합니다.

  2. 검사는 Sun Java System Application Server 서버로 연결한 다음 Monitor_Uri_List의 각 URI로 HTTP 요청을 보내고 응답을 받는 방식으로 HTTP 1.1 GET 검사를 수행합니다.

    각 HTTP 요청의 결과는 실패 또는 성공입니다. 모든 요청이 Sun Java System Application Server의 서버로부터 응답을 받는 데 성공했다면 다음 검사 및 일시 정지 주기가 수행됩니다.

    과도한 네트워크 트래픽이나 시스템 로드, 구성 오류가 발생하면 HTTP GET 검사가 실패할 수 있습니다. Monitor_Uri_List 등록 정보를 잘못 구성한 경우 Monitor_Uri_List의 URI에 잘못된 포트나 호스트 이름이 포함되면 장애가 발생할 수 있습니다. 예를 들어 응용 프로그램 서버 인스턴스가 논리 호스트 schost-1을 수신하고 URI가 http://schost-2/servlet/monitor로 지정된 경우 검사는 /servlet/monitor를 요청하려고 schost-2에 접촉을 시도합니다.

  3. 검사는 검사에 대한 응답을 Probe_timeout 제한 내에 받지 못하면 기록 로그에 오류를 기록합니다. 검사는 이 시나리오를 Sun Java System Application Server 데이터 서비스 일부가 실패한 것으로 간주합니다. Sun Java System Application Server 검사 실패는 전체 실패이거나 부분 실패일 수 있습니다.

    검사에 대한 응답이 Probe_timeout 제한 이내에 수신된다면 HTTP 응답 코드를 검사합니다. 응답 코드가 500 내부 서버 오류이면 검사는 전체 실패로 간주됩니다. 기타 모든 응답 코드는 무시됩니다.

    다음은 전체 검사 실패입니다.

    • 서버 연결 실패 시 다음 오류 메시지를 수신합니다. %s는 호스트 이름, %d는 포트 번호를 나타냅니다.


      Failed to connect to the host <%s> and port <%d>. Receiving a
      response code of 500 Internal Server Error HTTP GET
      Response Code for probe of %s is 500. Failover will be in
      progress
    • 검사 문자열을 서버로 보내는 데 실패하면 다음 오류 메시지를 수신합니다. 첫 번째 %s는 호스트 이름, %d는 포트 번호, 두 번째 %s는 해당 오류에 대한 자세한 내용을 나타냅니다.


      Write to server failed: server %s port %d: %s.
  4. 모니터는 Retry_interval 자원 등록 정보 설정 내에서 발생한 부분 실패를 전체 실패와 같아질 때까지 축적합니다.

    다음은 부분 검사 실패입니다.

    • Probe_timeout 설정이 지나기 전에 연결 해제가 실패하면 다음 오류 메시지를 수신합니다. %d는 포트 번호를 나타내고 %s는 자원 이름을 나타냅니다.


      Failed to disconnect from port %d of resource %s.
    • Probe_timeout 시간 이내에 모든 검사 단계를 완료하지 못하면 부분 실패가 됩니다.

    • 다음의 오류 메시지는 다른 이유로 서버에서 데이터를 읽는데 실패한 경우 표시됩니다. 첫 번째 %s는 호스트 이름, %d는 포트 번호, 두 번째 %s는 해당 오류에 대한 자세한 내용을 나타냅니다.


      Failed to communicate with server %s port %d: %s
  5. 장애가 있으면 오류 기록과 검사 매개 변수의 설정에 따라 로컬 재시작이나 데이터 서비스의 페일오버가 발생할 수 있습니다.

Monitor_Uri_List 등록 정보가 설정되지 않은 경우 오류 모니터 작업

Monitor_Uri_List 확장 등록 정보가 설정되지 않은 경우에는 오류 모니터 검사가 다음 단계를 실행합니다.

  1. 오류 모니터는 Probe_timeout 자원 등록 정보에 설정된 시간 초과 값에 따라 Sun Java System Application Server 인스턴스를 검사합니다.

  2. 검사는 다음과 같이 asadmin 명령을 사용하여 DAS(Domain Administration Server)의 상태를 파악합니다.


    $INSTALL_DIR/appserver/bin/asadmin list-domains --domaindir $DOMAIN_DIR

    다음의 환경 변수가 설정됩니다.

    • INSTALL_DIRConfdir_list 확장 등록 정보를 사용하여 설정한 설치 위치입니다.

    • DOMAIN_DIR는 도메인 디렉토리의 절대 경로입니다.

    • DOMAIN_NAME은 도메인 이름입니다.

  3. 검사에서 DAS가 실행되지 않음이 결정되면 전체 실패가 발생합니다.

  4. 장애가 있으면 오류 기록과 검사 매개 변수의 설정을 기초로 로컬 재시작이나 데이터 서비스의 페일오버가 발생할 수 있습니다.