Sun Cluster Geographic Edition 3.1 8/05 릴리스 노트

알려진 문제점 및 버그

다음의 알려진 문제점과 버그가 Sun Cluster Geographic Edition 3.1 8/05 릴리스의 사용에 영향을 미칩니다.

확장 SunPlex Manager GUI 제한 사항

문제점 요약: 장치 그룹이 포함된 보호 그룹을 삭제할 수 없습니다.

해결 방법:GUI를 사용하여 장치 그룹이 포함된 보호 그룹을 삭제하려면, 먼저 장치 그룹을 개별적으로 삭제하십시오. 그런 다음, 보호 그룹을 삭제하십시오.

java.util.logging.ErrorManager에 쓰기를 하면 Common Agent Container 로깅 오류가 발생함(5081674)

문제점 요약: java.io.InterruptedIOException 오류 메시지는 Common Agent Container 로그 파일 java.util.logging.ErrorManager에 로깅할 때 나타납니다.

해결 방법:이 예외는 해가 없으며 무시해도 안전합니다.

클러스터 재부트 후 Sun Cluster Geographic Edition 기반 구조가 오프라인 상태로 될 수도 있음 (6218200)

문제점 요약: 클러스터를 재부트한 후 Sun Cluster Geographic Edition 기반 구조가 오프라인 상태로 될 수도 있습니다.

해결 방법:

클러스터 재부트 후 Sun Cluster Geographic Edition 기반 구조가 오프라인되는 경우, geoadm start 명령을 사용하여 Sun Cluster Geographic Edition 기반 구조를 재시작하십시오.

GUI에 대한 RBAC 지원이 없음 (6226493)

문제점 요약: GUI는 RBAC를 지원하지 않습니다.

해결 방법:로컬 클러스터에서 루트로 GUI를 실행하십시오.

GUI에 파트너 클러스터에 대한 동일한 루트 암호가 필요함(6260505)

문제점 요약: 루트 암호를 사용하여 SunPlex Manager GUI에 액세스하려면, 루트 암호가 양 클러스터의 모든 노드에서 동일해야 합니다.

해결 방법:루트 암호가 양 클러스터의 모든 노드에서 동일한지 확인합니다.

다른 도메인의 파트너 클러스터가 클러스터 이름이 있는 도메인 이름을 포함할 수 없음(6260506)

문제점 요약: 다른 도메인의 파트너 클러스터는 클러스터 이름이 있는 도메인 이름을 포함할 수 없습니다.

해결 방법:파트너 클러스터 이름을 로컬 클러스터에서 각 노드의 /etc/hosts 파일에 있는 파트너 클러스터에 대한 논리 호스트 이름의 IP로 지정합니다. 버그 6252467도 참조하십시오.


주 –

수동으로 /etc/hosts 파일을 업데이트하면 동일한 이름의 로컬 도메인 시스템과 충돌할 수도 있습니다.


심박동과 파트너쉽을 연결하려면 사용자 정의 심박동이 원격 및 로컬 클러스터 모두에 존재해야 함(6263692)

문제점 요약: 사용자 정의 심박동을 사용하여 원격 클러스터에서 파트너쉽을 작성하는 경우, 파트너쉽과 연결하려면 동일한 이름의 심박동이 로컬 클러스터에 존재해야 합니다. GUI를 사용하여 심박동을 작성할 수 없으므로 Join Partnership 페이지에서 선택할 수 있는 적절한 심박동이 없습니다.

해결 방법:CLI를 사용하여 사용자 정의 심박동을 작성한 후 CLI 또는 GUI를 사용하여 파트너쉽을 연결합니다.

노드와 저장 장치 사이의 통신 두절로 인해 오류 상태가 될 수도 있음(6269186)

문제점 요약: sysevent 데몬이 손상된 경우 클러스터 상태는 Error 가 되고 심박동 상태는 No Reponse가 됩니다.

해결 방법: sysevent 데몬을 재시작하고 다음과 같이 Sun Cluster Geographic Edition 기반 구조를 재시작하십시오.

ProcedureSun Cluster Geographic Edition 기반 구조 재시작 방법

  1. Sun Cluster Geographic Edition 소프트웨어를 비활성화합니다.


    phys-paris-1# geoadm stop
  2. 클러스터의 노드에서 Sun Cluster Geographic Edition 기반 구조를 활성화합니다.


    phys-paris-1# geoadm start
참조

geoadm 명령에 대한 자세한 정보는 geoadm(1M) 매뉴얼 페이지를 참조하십시오.

sysevent 데몬이 손상된 경우 클러스터 상태는 Error임(6276483)

문제점 요약: sysevent 데몬이 손상된 경우 클러스터 상태는 Error 가 되고 심박동 상태는 No Reponse가 됩니다.

해결 방법: sysevent 데몬을 재시작하고 다음과 같이 Sun Cluster Geographic Edition 기반 구조를 재시작하십시오.

ProcedureSun Cluster Geographic Edition 기반 구조 재시작 방법

  1. Sun Cluster Geographic Edition 소프트웨어를 비활성화합니다.


    phys-paris-1# geoadm stop
  2. 클러스터의 노드에서 Sun Cluster Geographic Edition 기반 구조를 활성화합니다.


    phys-paris-1# geoadm start
참조

geoadm 명령에 대한 자세한 정보는 geoadm(1M) 매뉴얼 페이지를 참조하십시오.

보호 그룹이 시간 초과를 시작한 경우 오류 메시지가 불분명함(6284278)

문제점 요약: geopg start 명령이 시간 초과하는 경우, 다음 메시지가 나타납니다. “Waiting response timeout: 100000.” 이 메시지는 작업이 시간 초과되었음을 분명하게 설명하지 않습니다. 또한, 시간 초과 기간이 초 대신 밀리초로 설명됩니다.

해결 방법:없음.

geo-failovercontrol 자원이 STOP_FAILED 상태가 될 경우 자원이 시간 초과됨(6288257)

문제점 요약: 시스템 고부하로 인해 Common Agent Container가 멈추거나 반응 속도가 너무 느린 경우, geo-failovercontrol stop 방법이 시간 초과됩니다. 이 시간 초과로 인해 geo-failovercontrol 자원이 STOP_FAILED 상태가 됩니다.

해결 방법:stop_timeout 기간이 비교적 큰 10분이기 때문에 이런 문제는 드뭅니다. 그러나 geo-failovercontrol 자원이 STOP_FAILED 상태인 경우, 다음 절차를 사용하여 Sun Cluster Geographic Edition 기반 구조를 복구하고 활성화하십시오.

클러스터 재부트 후 활성화된 보호 그룹은 비활성화되고 자원 그룹은 Error 상태가 됨(6289463)

문제점 요약: 보호 그룹은 OK 상태의 자원 그룹이 있는 1차 클러스터에서 활성화됩니다. 1차 클러스터가 재부트된 경우, 클러스터가 다시 생길 때 보호 그룹은 비활성화된 상태에 있고 자원 그룹은 Error 상태가 됩니다.

해결 방법:장애 복구 전환 중, 절차 중 1 단계 a에서 설명한 대로 파트너쉽을 동기화하기 전에 보호 그룹을 비활성화해야 합니다.


# geopg stop -e Local  보호 그룹 이름
-e Local

명령의 범위를 지정합니다.

local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

protection-group-name

보호 그룹의 이름을 지정합니다.

보호 그룹이 이미 비활성화된 경우, 보호 그룹의 자원 그룹 상태는 Error일 수도 있습니다. 응용프로그램 자원 그룹이 관리되고 오프라인이기 때문에 해당 상태는 Error입니다.

보호 그룹 비활성화로 인해 Error 상태를 지워서 응용프로그램 자원 그룹을 더 이상 관리하지 않습니다.

전체 절차는 Sun Cluster Geographic Edition 시스템 관리 설명서Sun Cluster Geographic Edition 시스템 관리 설명서Sun StorEdge Availability Suite 3.2.1 복제를 사용하는 시스템에서 장애 복구-작업 전환을 수행하는 방법.

자원 그룹을 보호 그룹에 추가할 때 메시지가 올바르지 않음(6290256)

문제점 요약: 응용프로그램 자원 그룹이 보호 그룹에 추가될 때, 응용프로그램 자원 그룹 및 경량 자원 그룹이 동일한 보호 그룹에 있어야 함을 설명하는 메시지가 나타날 수도 있습니다. 이 메시지는 응용프로그램 자원 그룹이 경량 자원 그룹이 제어하는 장치 그룹과 동일한 보호 그룹에 있어야 함을 나타냅니다.

메시지와 상관없이, 경량 자원 그룹은 Sun Cluster Geographic Edition 소프트웨어에 의해 관리되므로 경량 자원 그룹을 보호 그룹에 추가하지 마십시오.

해결 방법:없음.

Sun StorEdge Availability Suite 3.2.1 및 Sun Cluster Geographic Edition 기반 구조 자원 그룹에 의해 제어된 장치 그룹을 지배하는 노드에서 공용 네트워크를 당겨 노드가 취소됨(6291382)

문제점 요약: Sun StorEdge Availability Suite 3.2.1 및 Sun Cluster Geographic Edition 기반 구조 자원 그룹 및 자원에 의해 제어된 장치 그룹을 지배하는 노드에서 공용 네트워크를 당김으로 인해 해당 노드가 공용 네트워크를 손실하고 취소됩니다.

해결 방법:없음.

Hitachi TrueCopy에 대해 실패한 전환은 일치하지 않는 볼륨 상태로 dev_group 내에서 쌍으로 유지됨(6295537)

문제점 요약: Hitachi TrueCopy CCI 안내서에 현재 문서화된 전환 절차는 올바르지만 SVOL-SSUS 인계 때문에 전환이 실패할 경우, dev_group으로 인해 pairvolchkpairsplit 명령이 실패하는 원인이 되는 일치하지 않는 볼륨 상태가 될 수도 있습니다.

해결 방법:dev_group 을 일치하는 볼륨 상태로 만들려면 dev_group 내의 쌍을 일치하는 볼륨 상태로 만듭니다. 해당 쌍을 일치하는 볼륨 상태로 만드는 데 사용되는 명령은 현재 쌍 상태 및 사용자가 1차로 만들려는(응용프로그램을 실행하는) 클러스터의 볼륨에 따라 다릅니다. Hitachi TrueCopy 명령 세트에 대해서는 Hitachi TrueCopy CCI 안내서를 참조하십시오. 그런 다음, Sun Cluster Geographic Edition 시스템 관리 설명서Hitachi TrueCopy 복제를 사용하는 시스템에서 작업 전환 실패에서 복구 절차를 완료하십시오.

Hitachi TrueCopy CCI 명령 및 Hitachi TrueCopy 자원이 활동 및 응답 중인데도 원격 horcmd가 활동하지 않는다고 보고함(6297384)

문제점 요약: 클러스터 노드가 통신용으로 다른 서브넷에서 두 개 이상의 네트워크 주소를 갖는 경우, /etc/horcm.conf 파일의 IP_addressNONE으로 설정해야 합니다. 네트워크 주소가 동일한 서브넷에 속한 경우에도 IP_address 필드를 NONE으로 설정해야 합니다.

IP_address 필드가 NONE으로 설정되지 않은 경우, Hitachi TrueCopy 명령은 원격 프로세스 horcmd가 활동 및 응답 중이어도 시간 초과 오류 ENORMT를 사용하여 예기치 않게 응답할 수 있습니다.

해결 방법:기본 Hitachi TrueCopy 시간 초과 값이 /etc/horcm.conf 파일에서 변경된 경우 SUNW.GeoCtlTC 자원 시간 초과 값을 업데이트하십시오. /etc/horcm.conf의 기본 Hitachi TrueCopy 시간 초과 값은 30초인 3000(10ms)입니다.

또한 Sun Cluster Geographic Edition 환경에 의해 작성된 SUNW.GeoCtlTC 자원은 기본 시간 초과가 3000(10ms)으로 설정되어 있습니다.

기본 Hitachi TrueCopy 시간 초과 값이 /etc/horcm.conf에서 변경된 경우, 자원 시간 초과 값은 아래에 논의된 연산 방식에 따라 업데이트되어야 합니다. 필요한 경우가 아니라면 /etc/horcm.conf 및 Hitachi TrueCopy 자원에 대한 기본 시간 초과 값을 변경하지 마십시오.

다음 등식은 다양한 요소를 기초로 하여 Hitachi TrueCopy 명령이 시간 초과하는 데 걸리는 시간에 대한 상한을 설정합니다.


주 –

다음 등식에서 단위는 초로 나타납니다.


예를 들어, horctimeout을 30으로 설정하고 numhosts를 2로 numretries를 2로 설정한 경우, Upper-limit-on-timeout은 120이 됩니다.

Upper-limit-on-timeout의 값을 기초로 하여, 다음 자원 시간 초과 값이 설정되어야 합니다. 기타 명령의 처리를 허용하려면 최소 60이 버퍼로 지정되어야 합니다.


Validate_timeout = Upper-limit-on-timeout + 60
Update_timeout = Upper-limit-on-timeout + 60
Monitor_Check_timeout = Upper-limit-on-timeout + 60
Probe_timeout = Upper-limit-on-timeout + 60
Retry_Interval = (Prote_timeout + Thorough_probe_interval) + 60

자원의 기타 시간 초과 매개변수는 기본 값을 포함해야 합니다.

시간 초과 값을 변경하려면 다음 단계를 완료하십시오.

  1. scswitch 명령을 사용하여 자원 그룹을 오프라인으로 만듭니다.

  2. scrgadm 명령을 사용하여 필요한 시간 초과 등록 정보를 업데이트합니다.

  3. scswitch 명령을 사용하여 자원 그룹을 온라인으로 만듭니다.

종속성 통과는 시스템 자원을 소비함(6297751)

문제점 요약: 종속성 통과는 많은 시스템 자원을 소비합니다.

해결 방법:없음.

보호 그룹 전환이 분명한 이유 없이 실패하고 실패 이유를 보고하지 않음(6299103)

문제점 요약: 때때로 geopg switchover 명령이 실패하고 실패에 대한 이유를 설명하지 않습니다.

해결 방법:Sun Cluster Geographic Edition 시스템 관리 설명서Hitachi TrueCopy 복제를 사용하는 시스템에서 작업 전환 실패에서 복구 절차를 따르십시오.

GUI가 항상 장치 그룹 작성 또는 장치 그룹을 보호 그룹에 추가하는 결과를 반환하지는 않음(6300168)

문제점 요약: 장치 그룹 작성 또는 보호 그룹에 대한 장치 그룹 추가가 브라우저 내에 허용된 시간 초과 기간보다 더 오래 소요되는 경우, GUI는 작업이 완료될 때 갱신하지 않을 수도 있습니다.

해결 방법:GUI의 파트너쉽 페이지를 탐색하거나 geopg list 명령을 사용하여 작업 결과를 볼 수 있습니다.

명령을 실행하는 동안 Geocontrol 모듈이 활성화되는 노드가 재부트하는 경우 CLI 명령이 멈춤(6300616)

문제점 요약: 서버 쪽 소켓이 부분적으로 닫히거나 손상된 경우 cacaocsc 프로세스가 때때로 멈춥니다. 버그 6304065도 참조하십시오.

해결 방법:Ctrl+C 또는 kill 명령을 사용하여 명령을 종료하십시오.

전환이 진행 중인 동안 Common Agent Container를 시작하여 CRITICAL INTERNAL ERROR 오류가 발생함(6302009)

문제점 요약: 전원이 손실된 기반 구조 자원 그룹을 지배하는 노드와 같이 전환 프로세스 중 클러스터가 실패하는 경우, 불분명한 메시지가 반환됩니다.

해결 방법:없음.

GUI가 보호 그룹 상태 변경 사항을 갱신하지 않음(6302217)

문제점 요약: GUI로 표시된 페이지에서 엔티티의 구성 및 상태 변경 사항으로 인해 페이지가 자동으로 갱신됩니다. 때때로 갱신이 발생하지 않습니다.

해결 방법:탐색 트리를 사용하여 다른 페이지를 탐색한 후 원래의 페이지로 되돌아옵니다. 재로드하여 갱신됩니다.

Sun StorEdge Availability Suite 3.2.1 구성 데이터베이스를 업데이트하는 두 개 이상의 작업을 동시에 수행하면 구성 데이터베이스가 손상될 수도 있음(6303883)

문제점 요약: Sun Cluster 환경에서 Sun StorEdge Availability Suite 3.2.1 구성 데이터베이스를 업데이트하는 두 가지 이상의 작업을 동시에 수행하지 마십시오.

Sun Cluster Geographic Edition 소프트웨어를 실행 중인 경우, Sun StorEdge Availability Suite 3.2.1에 의해 복제된 데이터를 사용하여 다른 보호 그룹에서 다음 명령 중 두 개 이상을 동시에 수행하지 마십시오.

예를 들어, geopg start pg1 명령 및 geopg switchover pg2 명령을 동시에 실행하면 Sun StorEdge Availability Suite 3.2.1 구성 데이터베이스를 손상시킬 수도 있습니다.


주 –

Sun StorEdge Availability Suite 3.2.1은 Solaris OS 10에서 지원되지 않습니다. Solaris OS 10을 실행할 경우, Sun StorEdge Availability Suite 3.2.1 지원용 Sun Cluster Geographic Edition 패키지를 설치하지 마십시오.


해결 방법:Sun Cluster 구성이 두 개 이상의 노드로 구성되어 있는 경우, 두 파트너 클러스터의 노드 모두에 Sun StorEdge Availability Suite 3.2.1 dscfglockd 데몬 프로세스를 활성화해야 합니다. Sun Cluster 구성이 단일 노드만으로 구성되어 있는 경우, 이 데몬을 활성화할 필요가 없습니다.

dscfglockd 데몬 프로세스를 활성화하려면 두 파트너 클러스터의 노드 모두에 다음 절차를 완료하십시오.

ProcedureSun StorEdge Availability Suite 3.2.1 dscfglockd 데몬 프로세스 활성화 방법

  1. Sun StorEdge Availability Suite 3.2.1 제품 설명서의 안내대로 Sun StorEdge Availability Suite 3.2.1 제품이 설치되어 있는지 확인합니다.

  2. Sun StorEdge Availability Suite 3.2.1 제품이 http://sunsolve.sun.com에서 SunSolve에 사용 가능한 최신 패치로 되어 있는지 확인합니다.

  3. /etc/init.d/scm 사본을 작성합니다.


    # cp /etc/init.d/scm /etc/init.d/scm.original
  4. /etc/init.d/scm 파일을 편집합니다.

    다음 줄에서 주석문 (#) 및 주석 “(turned off for 3.2)”를 삭제합니다.


    # do_stopdscfglockd (turned off for 3.2)
    	# do_dscfglockd (turned off for 3.2)
  5. 편집한 파일을 저장합니다.

  6. 모든 Sun Cluster 노드를 재부팅할 필요가 없을 경우, 수퍼유저 권한이 있는 시스템 관리자는 각 노드에 다음 명령을 실행해야 합니다.


    # /usr/opt/SUNWscm/lib/dscfglockd \
    -f /var/opt/SUNWesm/dscfglockd.cf
다음 순서

지원이 더 필요한 경우, Sun 서비스 센터에 문의하십시오.

활성 1차 클러스터의 보호 그룹 인계 및 전환으로 인해 응용프로그램 자원 그룹이 재활용됨(6304781)

문제점 요약: 보호 그룹이 활성화되어 있는 1차 클러스터에서 geopg takeover 또는 geopg switchover 명령을 실행하면 보호 그룹의 응용프로그램 자원 그룹이 오프라인되어 관리되지 않다가 동일한 클러스터에서 다시 온라인 상태가 됩니다.

해결 방법:없음.

geops create 또는 geops join 작업이 실행되는 동안 노드를 가져온 후 Sun Cluster Geographic Edition 기반 구조를 시작할 수 없음(6305780)

문제점 요약: geops create 또는 geops join명령을 실행하는 동안 노드를 가져온 경우, Sun Cluster Geographic Edition 기반 구조를 재시작할 수 없습니다.

해결 방법:Sun 서비스 센터에 문의하십시오.

보호 그룹 역할 및 데이터 복제 역할이 보호 그룹 전환이 시간 초과한 경우 일치하지 않음(6306759)

문제점 요약: geopg switchover 명령이 시간 초과한 경우 보호 그룹 역할이 데이터 복제 역할과 일치하지 않을 수도 있습니다. 이러한 불일치에도 불구하고 geoadm status 명령은 구성이 Error 상태가 아닌 OK 상태에 있음을 표시합니다.

해결 방법:전환 또는 인계 시간 초과 후 양 클러스터에서 geopg validate 명령을 사용하여 보호 그룹을 다시 확인합니다.

실패한 보호 그룹 인계 후 동기화 상태가 ERROR가 됨 (6307131)

문제점 요약: 인계 작업이 원래의 1차 클러스터의 역할을 변경할 수 없는 경우, 동기화 상태는 ERROR가 됩니다.

해결 방법:geopg update 명령을 사용하여 보호 그룹을 재동기화한 후 geopg validate 명령을 사용하여 원래의 1차 클러스터의 보호 그룹을 확인합니다.

인계 작업이 기존 1차를 2차로 변경하는 데 실패한 경우에도 오류 메시지 없음(6309228)

문제점 요약: geopg takeover 명령이 성공을 반환하지만 보호 그룹이 양 클러스터에서 1차 상태로 있습니다.

해결 방법:없음.

Common Agent Container가 잠시 동안 실행된 후 멈출 수 있음 (6383202)

문제점 요약: Common Agent Container가 잠시 동안 실행된 후 멈출 수 있습니다.

해결 방법:없음.