Sun Custer 3.0 5/02 추가 정보

중앙 인스턴스에 대한 SAP용 Sun Cluster HA 결함 프로브

중앙 인스턴스에 대하여 결함 프로브가 다음과 같은 단계를 실행합니다.

  1. 프로세스 ID에서 SAP Message Server 및 디스패처를 검색합니다

  2. 무한 루프를 실행합니다(Thorough_probe_interval 동안은 정지)

  3. SAP 자원의 안정성을 검사합니다

    1. 비정상 종료 - PMF(Process Monitor Facility)가 SAP 프로세스 트리에 장애가 발생한 것을 발견하면 결함 모니터가 이 문제를 완전한 장애로 처리합니다. 자원의 장애 기록에 따라 결함 모니터가 SAP 자원을 다시 시작하거나 다른 노드로 페일오버합니다.

    2. 프로브를 통한 SAP 자원의 안정성 검사 - 프로브는 ps(1) 명령을 사용하여 SAP Message Server와 기본 디스패처 프로세스를 검사합니다. 시스템의 작동 프로세스 목록에서 SAP Message Server나 기본 디스패처 프로세스 중에 빠진 것이 있으면 결함 모니터가 이 문제를 완전한 장애로 처리합니다.

      매개 변수 Check_ms_retry에 0보다 큰 값을 구성하면 프로브가 SAP Message Server 연결을 검사합니다. 확장 등록 정보 Lgtst_ms_with_logicalhostname을 기본값 TRUE로 설정했으면 프로브가 lgtst 유틸리티를 사용하여 SAP Message Server 연결 테스트를 완료합니다. 프로브는 SAP 자원 그룹에 지정된 논리 호스트 이름 인터페이스를 사용하여 SAP에서 제공하는 유틸리티 lgtst를 호출합니다. 확장 등록 정보 Lgtst_ms_with_logicalhostnameTRUE가 아닌 값으로 설정하면 프로브가 노드의 로컬 호스트 이름과 함께 lgtst를 호출합니다(루프백 인터페이스).

      lgtst 유틸리티가 장애를 호출하면 SAP Message Server 연결이 작동하지 않는 것입니다. 이 경우에는 결함 모니터가 문제를 부분적인 장애로 처리하여 SAP 재시작이나 페일오버를 즉시 트리거하지 않습니다. 다음과 같은 상태에서는 결함 모니터가 부분적인 장애 두 가지를 완전한 장애로 처리합니다.

      1. 확장 등록 정보 Check_ms_retry2로 구성한 경우.

      2. 결함 모니터가 자원 등록 정보 Retry_interval이 설정하는 재시도 간격 내에 발생하는 두 가지 부분적인 장애를 누적하여 발견한 경우.

      완전한 장애가 발생하면 자원의 장애 기록에 따라 로컬 재시작이나 페일오버가 트리거됩니다.

    3. 프로브를 통한 데이터베이스 연결 상태 - 프로브가 SAP에서 제공하는 유틸리티 R3trans를 호출하여 데이터베이스 연결 상태를 검사합니다. SAP용 Sun Cluster HA 결함 프로브는 SAP가 데이터베이스에 연결할 수 있는지를 확인합니다. 그러나 SAP용 Sun Cluster HA는 가용성이 높은 데이터베이스 결함 프로브를 통해 데이터베이스의 안정성을 확인합니다. 데이터베이스 연결 상태를 검사할 수 없으면 결함 모니터가 Database might be down 메시지를 syslog에 기록합니다. 그런 다음 결함 모니터가 SAP 자원의 상태를 DEGRADED로 설정합니다. 프로브가 데이터베이스의 상태를 다시 검사하여 연결이 다시 정상 상태가 되었으면 결함 모니터가 Database is up 메시지를 syslog에 기록하고 SAP 자원의 상태를 OK로 설정합니다.

  4. 장애 기록을 평가합니다

    장애 기록에 따라 결함 모니터가 다음 중 한 가지 작업을 완료합니다.

    • 작업 안함

    • 로컬 재시작

    • 페일오버