Solaris OS용 Sun Java System Application Server에 대한 Sun Cluster 데이터 서비스 안내서

Sun Cluster HA for Sun Java System Application Server의 오류 모니터 조정

Sun Cluster HA for Sun Java System Application Server(8.1 이전 버전 지원)의 오류 모니터는 자원 유형이 SUNW.s1as인 자원에 포함됩니다.

자원 유형의 시스템 등록 정보와 확장 등록 정보는 오류 모니터의 동작을 제어합니다. 이 등록 정보의 기본값은 오류 모니터의 미리 설정된 동작을 결정합니다. 미리 설정된 동작은 대부분의 Sun Cluster 설치에 적합해야 합니다. 따라서 미리 설정된 동작을 수정해야 하는 경우에만 오류 모니터를 조정해야 합니다.

오류 모니터 조정에는 다음 작업이 포함됩니다.

Sun Cluster HA for Sun Java System Application Server를 등록하고 구성하는 작업은 Sun Cluster HA for Sun Java System Application Server(8.1 이전 버전 지원) 등록 및 구성에 설명된 대로 수행합니다.

이 작업에 대한 자세한 내용은 Sun Cluster Data Services Planning and Administration Guide for Solaris OSTuning Fault Monitors for Sun Cluster Data Services를 참조하십시오.

이 절에서는 다음 내용을 설명합니다.

검사 중에 Sun Cluster HA for Sun Java System Application Server 오류 모니터가 수행하는 작업

Sun Cluster HA for Sun Java System Application Server 오류 모니터 검사에서는 Sun Java System Application Server 서버 상태를 쿼리하도록 서버로 요청을 보냅니다. 검사는 다음 단계로 수행됩니다.

  1. 오류 모니터는 Probe_timeout 자원 등록 정보에 설정된 시간 초과 값에 따라 Sun Java System Application Server 인스턴스를 검사합니다.

  2. 검사는 네트워크 자원 구성에 정의된 IP 주소와 포트 결합을 자원 그룹의 Port_list 설정과 연결합니다. Port_list가 비어 있지 않은 채로 자원이 구성되면 이 단계는 건너뜁니다. 연결이 성공하면 검사는 연결 해제됩니다. 연결이 실패하면 실패가 기록됩니다.

    과도한 네트워크 트래픽이나 시스템 로드, 구성 오류가 발생하면 쿼리가 실패할 수 있습니다. Sun Java System Application Server 서버가 검사 대상인 모든 IP 주소/포트 조합에서 수신하도록 구성하지 않으면 구성 오류가 발생할 수 있습니다. Sun Java System Application Server 서버는 이 자원에 대해 지정된 모든 IP 주소의 모든 포트를 처리해야 합니다.

  3. 검사는 Sun Java System Application Server 서버로 연결한 다음 Monitor_Uri_List의 각 URI로 HTTP 요청을 보내고 응답을 받는 방식으로 HTTP 1.1 GET 검사를 수행합니다.

    각 HTTP 요청의 결과는 실패 또는 성공입니다. 모든 요청이 Sun Java System Application Server의 서버로부터 응답을 받는 데 성공했다면 다음 검사 및 일시 정지 주기가 수행됩니다.

    과도한 네트워크 트래픽이나 시스템 로드, 구성 오류가 발생하면 HTTP GET 검사가 실패할 수 있습니다. Monitor_Uri_List 등록 정보를 잘못 구성한 경우 Monitor_Uri_List의 URI에 잘못된 포트나 호스트 이름이 포함되면 장애가 발생할 수 있습니다. 예를 들어 응용 프로그램 서버 인스턴스가 논리 호스트 schost-1을 수신하고 URI가 http://schost-2/servlet/monitor로 지정된 경우 검사는 /servlet/monitor를 요청하기 위해 schost-2에 접촉을 시도합니다.

  4. 검사는 검사에 대한 응답을 Probe_timeout 한도 내에 받지 못하면 기록 로그에 오류를 기록합니다. 검사는 이 시나리오를 Sun Java System Application Server 데이터 서비스 일부가 실패한 것으로 간주합니다. Sun Java System Application Server 검사 실패는 전체 실패이거나 부분 실패일 수 있습니다.

    검사에 대한 응답이 Probe_timeout 제한 이내에 수신된다면 HTTP 응답 코드를 검사합니다. 응답 코드가 500 내부 서버 오류인 경우 검사는 전체 실패로 간주됩니다. 기타 모든 응답 코드는 무시됩니다.

    다음은 전체 검사 실패입니다.

    • 서버 연결 실패 시 다음 오류 메시지를 수신합니다. %s는 호스트 이름, %d는 포트 번호를 나타냅니다.


      Failed to connect to the host <%s> and port <%d>. Receiving a
      response code of 500 Internal Server Error HTTP GET
      Response Code for probe of %s is 500. Failover will be in
      progress
    • 검사 문자열을 서버로 보내는 데 실패하면 다음 오류 메시지를 수신합니다. 첫 번째 %s는 호스트 이름, %d는 포트 번호, 두 번째 %s는 해당 오류에 대한 자세한 내용을 나타냅니다.


      Write to server failed: server %s port %d: %s.
  5. 모니터는 Retry_interval 자원 등록 정보 설정 내에서 발생한 부분 실패를 전체 실패와 동일해질 때까지 축적합니다.

    다음은 부분 검사 실패입니다.

    • Probe_timeout 설정이 지나기 전에 연결 해제가 실패하면 다음 오류 메시지를 수신합니다. %d은(는) 포트 번호를 나타내고 %s은(는) 자원 이름을 나타냅니다.


      Failed to disconnect from port %d of resource %s.
    • Probe_timeout 시간 이내에 모든 검사 단계를 완료하지 못하면 부분 실패가 됩니다.

    • 다음의 오류 메시지는 다른 이유로 서버에서 데이터를 읽는 데 실패한 경우 표시됩니다. 첫 번째 %s는 호스트 이름, %d는 포트 번호, 두 번째 %s는 해당 오류에 대한 자세한 내용을 나타냅니다.


      Failed to communicate with server %s port %d: %s
  6. 실패가 발생하면 실패 기록에 따라 로컬 재시작이나 데이터 서비스 페일오버가 발생할 수 있습니다.