Sun Cluster 3.0 12/01 개념

PNM(Public Network Management) 및 NAFO(Network Adapter Failover)

클라이언트는 공용 네트워크 인터페이스를 통해 클러스터에 데이터를 요청합니다. 각 클러스터 노드는 공용 네트워크 어댑터를 통 해 하나 이상의 공용 네트워크에 연결됩니다.

Sun Cluster PNM(Public Network Management) 소프트웨어는 공용 네트워크 어댑터를 모니터하고 결함이 발견될 경우에 한 어댑터에서 다른 어댑터로 IP 주소를 페일오버하기 위한 기본 메커니즘을 제공합니다. 클러스터 노드마다 고유한 PNM 구성이 있기 때문에 다른 클러스터 노드에서는 구성이 다를 수 있습니다.

여러 개의 공용 네트워크 어댑터가 NAFO 그룹(네트워크 어댑터 페일오버 그룹)을 구성합니다. 각 NAFO 그룹에는 하나 이상의 공용 네트워크 어댑터가 있습니다. 각 NAFO 그룹에서 동시에 하나의 어댑터만 작동할 수 있고, 동일한 그룹에 속한 다른 어댑터는 PNM 데몬이 작동하는 어댑터에 대하여 결함을 발견하여 어댑터 페일오버가 발생할 경우에 사용되는 백업 어댑터 기능을 합니다.페일오버는 작동하는 어댑터와 연결된 IP 주소를 백업 어댑터로 전환하여 노드에 대한 공용 네트워크 연결을 유지합니다. 페일오 버는 어댑터 인터페이스 레벨에서 발생하기 때문에 TCP와 같은 고급 연결은 페일오버의 영향을 받지 않고 짧은 지연만 발생합니다.


주 -

페일오버 중에 일부 세그먼트가 손실될 수 있기 때문에 TCP의 혼잡 복구 특성으로 인해 TCP에서 혼잡 제어 메커니즘을 작동하기위해 성공적인 페일오버 후에 TCP 엔드포인트에 추가 지연이 발생할 수 있습니다.


NAFO 그룹은 논리 호스트 이름 및 공유 주소 자원에 대한 빌딩 블록을 제공합니다. scrgadm(1M) 명령은 필요할 경우에 자동으로 NAFO 그룹을 만듭니다. 또한 사용자도 논리 호스트 이름과 공유 주소 자원의 NAFO 그룹을 독립적으로 만들어서 클러스터 노드에 대한 공용 네트워크 연결을 모니터할 수 있습니다. 한 노드의 동일한 NAFO 그룹이 여러 논리 호스트 이름이나 공유 주소 자원을 호스팅할 수 있습니다. 논리 호스트 이름 및 공유 자원에 대한 자세한 내용은 Sun Cluster 3.0 12/01 Data Services Installation and Configuration Guide를 참조하십시오.


주 -

NAFO 메카니즘은 어댑터 장애를 발견하여 마스크하도록 설계되었습니다. 이것은 관리자가 ifconfig(1M) 명령으로 논리(또는 공유) IP 주소 중 하나를 제거하여 복구하기 위해 설계된 것이 아닙니다. Sun Cluster 소프트웨어는 논리 및 공유 IP 주소를 RGM에 의해 관리되는 자원으로 인식합니다. 관리자가 정확하게 IP 주소를 추가하거나 제거하려면 scrgadm(1M) 명령을 사용하여 자원이 포함된 자원 그룹을 수정해야 합니다.


PNM 결함 발견 및 페일오버 프로세스

PNM은 어댑터를 통과하는 정상적인 네트워크 트래픽 때문에 정상 어댑터의 패킷 카운터가 변경된다고 가정하고 작동 어댑터의 패킷 카운터를 주기적으로 확인합니다. 패킷 카운터가 일정 시간 동안 변경되지 않으면 PNM이 ping 시퀀스가 되어 트래픽을 강제로 현재 작동하는 어댑터로 보냅니다. PNM은 각 시퀀스의 끝에서 패킷 카운터의 변경을 확인하고, 핑 시퀀스가 여러 번 반복된 후에도 패킷 카운터가 변경되지 않으면어댑터 결함을 선언합니다. 이러한 이벤트가 발생하면 사용할 수 있는 백업 어댑터로 페일오버가 트리거됩니다.

입력 패킷과 출력 패킷의 카운터 모두 또는 두 패킷 카운터 중 하나가 일정 시간 동안 변경되지 않으면 핑 시퀀스가 시작되도록 PNM이 입력 패킷과 출력 패킷의 카운터를 모니터합니다.

핑 시퀀스는 ALL_ROUTER 멀티캐스트 주소(224.0.0.2), ALL_HOST 멀티캐스트 주소(224.0.0.1) 및 로컬 서브넷 브로드캐스트 주소에 대한 핑으로 구성됩니다.

핑은 최소 비용 우선(least-costly-first) 방식으로 구성되므로 비용이 적게 드는 핑이 성공하면 비용이 많이 드는 핑은 실행되지 않습니다. 또한 핑은 어댑터에 트래픽을 발생시키는 수단으로만 사용됩니다. 핑의 종료 상태는 어댑터가 작동하는지 아니면 결함이 있는지를판단하는 데는 도움이 되지 않습니다.

이 알고리즘에는 네 가지의 조정가능한 매개변수가 있습니다. inactive_time, ping_timeout, repeat_testslow_network가 그 매개변수입니다. 이 매개 변수를 사용하면 장애 감지 속도와 정확도를 상대적으로 조정할 수 있습니다. 매개변수에 대한 세부사항과 변경 방법에 대해서는 Sun Cluster 3.0 12/01 시스템 관리 안내서에서 공용 네트워크 매개변수를 변경하는 절차를 참조하십시오.

NAFO 그룹의 작동 어댑터에서 결함이 발견된 후에 백업 어댑터를 사용할 수 없으면 그룹이 DOWN으로 선언되고 백업 어댑터에 대한 테스트가 계속됩니다. 그렇지 않고 백업 어댑터를 사용할 수 있으면 백업 어댑터로 페일오버가 발생합니다. 결함이 있는 작동어댑터가 중지되어 제거된 동안에는 논리 주소 및 관련 플래그가 백업 어댑터로 "이동"됩니다.

IP 주소 페일오버가 성공적으로 완료되면 ARP 브로드캐스트가 전송됩니다. 따라서 원격 클라이언트에 대한 연결이 유지됩니다.