8 ACSLS HA 세부 조정

이 장에서는 라이브러리 컴플렉스에 최적의 페일오버 정책을 설정하는 방법, 원치 않는 페일백 이벤트를 방지하기 위해 기본 pingpong 간격을 조정하는 방법 및 페일오버 이벤트에 대해 전자 메일 알림을 등록하는 방법에 대해 설명합니다.

라이브러리 통신을 위한 페일오버 정책 정의

ACSLS HA 에이전트는 ACSLS 및 연결된 라이브러리 사이의 통신을 지속적으로 모니터합니다. 이러한 통신은 지속적인 ACSLS 운영에 핵심적입니다. 하지만 실패한 라이브러리 통신에서 수행해야 할 작업(있는 경우)은 로컬 ACSLS HA 관리자에 의해 결정되는 정책에 따라 달라집니다.

정책 테이블 $ACS_HOME/acslsha/ha_acs_list.txt를 사용해서 로컬 관리자는 HA 복구가 필요한 모든 ACS에 대해 원하는 페일오버 작업을 정의할 수 있습니다. 라이브러리 통신 오류 시, 그리고 관리자의 지시에 따라 ACSLS HA 에이전트는 대체 노드에서 ACS 통신이 성공적으로 확인된 경우 해당 노드로 페일오버를 수행합니다.

다중 ACS 환경에서는 단일 ACS와의 통신이 실패할 때 ACSLS HA 시스템이 페일오버를 수행하는 것이 바람직할 수 있습니다. 페일오버 작업이 연결된 모든 라이브러리의 운용을 중단하기 때문에 관리자는 데이터 센터에서 더 중요한 ACS에 대해 일반적인 페일오버 작업을 제한하는 방법을 선호할 수 있습니다. 정책 레코드는 라이브러리 통신이 손실될 때 클러스터 페일오버 작업이 필요한 각 ACS에 대한 ha_acs_list.txt에 생성됩니다. 각 레코드에는 다음 2개 필드가 포함됩니다.

ACS Number   Fail-over Action (true or false)

첫번째 필드는 ACS ID이고 두번째 필드는 true 또는 false의 부울 값입니다. 정책 설정의 논리는 다음과 같습니다.

  • 두번째 필드가 false이면 ACS에 대한 통신이 실패하고 복원할 수 없는 경우에도 ACSLS HA 에이전트가 대체 노드에 대한 클러스터 페일오버 작업을 시작하지 않습니다.

  • 두번째 필드가 true이면 주 노드로부터의 통신을 다시 설정하려는 시도가 실패할 때마다 ACSLS HA 에이전트는 클러스터 페일오버 작업을 명제화합니다. 시스템은 대체 노드에서 라이브러리 연결이 확인된 경우에만 페일오버를 수행합니다.

이 파일에 나열되지 않은 ACS의 경우 기본 작업은 false입니다.

RE(중복 전자 부품)를 포함하는 라이브러리

RE(중복 전자 부품)가 포함된 라이브러리의 경우 ACSLS HA 에이전트는 클러스터 페일오버 작업을 선택하기 전에 통신을 대체 RE 경로로 전환하려고 시도합니다. 이러한 RE 전환 작업은 단일 SL8500 또는 SL3000이나 이중 LMU를 포함하는 오래된 9310에만 적용됩니다. 분할된 라이브러리에서는 자동 RE 전환이 시도되지 않습니다.

페일오버 Pingpong_interval 설정

Solaris Cluster Pingpong_interval은 첫번째 클러스터 페일오버 이벤트 이후 전체 복구를 복원할 수 없는 경우 페일오버 작업이 반복되지 않도록 방지하는 시간 초과 등록 정보입니다.

이 등록 정보는 ACSLS 리소스 그룹에 대한 사용자 수정 가능한 등록 정보입니다. 기본값은 20분으로 설정됩니다. 이 설정의 경우 첫번째 페일오버 이벤트는 ACSLS HA 에이전트에서 페일오버 작업을 요청할 때 즉시 발생합니다. 하지만 페일오버 작업을 트리거할 수 있는 조건이 새 클러스터 노드에서 지워지지 않은 경우에는 정의된 pingpong 간격이 만료될 때까지 이후의 페일오버 작업이 지연됩니다. 그 결과 근본 문제가 해결될 때까지 하나의 클러스터 노드와 다른 노드 사이의 불필요한 제어 충돌이 방지됩니다.

이 등록 정보의 기본 설정을 변경하려면 $ACS_HOME/acslsha/pingpong_interval 파일에 정의된 기본 숫자를 수정하면 됩니다. 해당 숫자는 초로 표현됩니다.

기본 설정인 1200초는 대부분의 중간 라이브러리부터 큰 라이브러리 구성까지 적합한 설정입니다. 이 등록 정보에 대한 최적의 시간 초과 값은 라이브러리 구성에 존재하는 실제 LSM 및 테이프 드라이브 수에 따라 달라집니다. 더 큰 라이브러리 구성에서는 페일오버 이벤트 후 복구하는 데 시간이 이보다 오래 걸리므로 LSM이 10개 이상이거나 드라이브가 40개 이상인 시스템 구성에서는 이 숫자 간격을 더 크게 설정해야 합니다.

40개 LSM 구성의 경우에는 1800(30분)으로 설정하는 것이 좋으며, 1~4개 LSM으로 구성된 작은 라이브러리의 경우에는 900(15분)으로 설정하는 것이 좋습니다.

여기에서 수행한 변경 사항은 acsAgt configure 명령을 사용하여 ACSLS HA를 재구성할 때까지 적용됩니다.

# cd /opt/ACSLSHA/util
# ./acsAgt configure

이 명령은 acsls-rg 리소스 그룹이 이미 활성화되어 있는 경우에도 명제화될 수 있습니다. 일반적인 HA 작업에 영향을 주지 않고 새로운 기본 설정을 등록합니다.

pingpong_interval 설정은 acsAgt pingpong을 사용하여 테스트를 위해 동적으로 변경할 수 있습니다. 이 명령을 사용하는 값 세트는 acsAgt configure로 리소스 그룹을 다시 시작할 때까지 유효합니다.

시스템 이벤트의 전자 메일 알림 등록

관리 책임이 있는 사용자는 시스템 부트 이벤트 및 ACSLS HA 클러스터 페일오버 이벤트를 포함해서 시스템 이벤트의 자동 전자 메일 알림을 등록할 수 있습니다.

이러한 이벤트를 등록하려면 사용자가 자신의 전자 메일 주소를 다음 디렉토리 아래의 해당 파일에 추가해야 합니다.

$ACS_HOME/data/external/email_notification/
   boot_notification
   ha_failover_notification

제목 표시 아래에 각 받는 사람에 대한 전자 메일 주소를 한 라인에 입력합니다. 그런 다음에는 시스템이 부트되거나 HA 클러스터가 대기 노드로 페일오버를 수행할 때마다 등록된 각 사용자에게 전자 메일 알림이 전송됩니다.

이 기능은 메일 전송 서비스가 ACSLS 서버에 사용으로 설정되었고 네트워크 방화벽 제약 조건에서 데이터 센터로부터의 전자 메일 통신이 허용된다고 가정합니다.