Sun Cluster 3.1 릴리스 정보

알려진 문제점 및 버그

다음의 알려진 문제점과 버그가 Sun Cluster 3.1 릴리스의 운영에 영향을 미칩니다. 최신 정보를 얻으려면 http://docs.sun.com에 있는 온라인 Sun Cluster 3.1 Release Notes Supplement를 참조하십시오.

잘못된 대형 파일 상태(4419214)

문제점 요약: /etc/mnttab 파일에 전역으로 마운트된 VxFS 파일 시스템의 최신 대형 파일 상태가 표시되지 않습니다.

해결 방법: /etc/mnttab 항목 대신 fsadm 명령을 사용하여 파일 시스템 대형 파일 상태를 확인하십시오.

전역 VxFS 파일 시스템이 블록 할당을 로컬 VxFS와 다르게 나열(4449437)

문제점 요약: 주어진 파일 크기에 대해 전역 VxFS 파일 시스템은 로컬 VxFS 파일 시스템보다 더 많은 디스크 블록을 할당하는 것처럼 보입니다.

해결 방법: 파일 시스템을 마운트 해제한 다음 다시 마운트하면 주어진 파일에 할당된 것처럼 보고된 추가 디스크 블록이 제거됩니다.

qfe 경로를 찾지 못하는 노드(4526883)

문제점 요약: qfe 어뎁터에서 끝나는 전용 상호 연결 전송 경로가 온라인이 되지 못하는 경우가 가끔 있습니다.

해결 방법: 다음 단계를 따릅니다.

scstat -W를 사용하여 결함이 있는 어뎁터를 확인합니다. faulted 또는 waiting 상태에서 해당 어뎁터를 경로 끝점의 하나로 가지고 있는 모든 전송 경로가 출력됩니다.
scsetup을 사용하여 클러스터 구성에서 이 어뎁터에 연결된 모든 케이블을 제거합니다.
다시 scsetup을 사용하여 클러스터 구성에서 이 어뎁터를 제거합니다.
어뎁터와 케이블을 다시 추가합니다.
경로가 나타나는지 확인합니다. 문제가 지속되면 단계1에서 5까지를 몇 번 반복합니다.
경로가 나타나는지 확인합니다. 그래도 문제가 해결되지 않으면 결함이 있는 어뎁터의 노드를 재부트합니다. 노드를 재부트하기 전에 남은 클러스터에 노드를 재부트하는 데 필요한 정족수 개수가 충분한지 확인하십시오.

스파스 파일 홀(Sparse File Holes)에 쓰기한 다음 파일 블록이 갱신되지 않음(4607142)

문제점 요약: 스파스 파일 내에서 블록 할당 쓰기 작업을 수행한 후에는 전체 클러스터에 걸쳐 파일의 블록 수가 항상 일관된 것은 아닙니다. UFS(또는 VxFS 3.4)에 놓인 클러스터 파일 시스템의 경우, 클러스터 노드 간의 블록 불일치는 30초 정도 이내에 사라집니다.

해결 방법: 이후의 메타 데이터 작업에서 일관된 st_blocks 값이 얻어지도록 inode(touch 등)를 갱신하는 파일 메타 데이터 작업으로 st_blocks 값이 동기화되어야 합니다.

`forcedirectio`와 `mmap`(2)을 동시에 사용하는 경우 패닉 발생(4629536)

문제점 요약: forcedirectio 마운트 옵션과 mmap(2) 함수를 동시에 사용하면 데이터가 손상되고 시스템이 멈출 수 있습니다.

해결 방법: 다음 제한 사항을 참조하십시오.

다시 마운트할 때 추가되는 파일 시스템을 directio 마운트 옵션을 사용하여 다시 마운트하지 마십시오.
directio ioctl을 사용하여 단일 파일에 대하여 directio 마운트 옵션을 설정하지 마십시오.

directio를 사용해야 할 경우에는 directio 옵션을 사용하여 전체 파일 시스템을 마운트하십시오.

클러스터 파일 시스템의 마운트가 해제되지 않음(4656624)

문제점 요약: fuser 명령어를 사용하면 어떤 노드에도 사용자가 없는 것으로 나오지만 가끔 클러스터 파일 시스템의 마운트가 해제되지 않습니다.

해결 방법: 기본 파일 시스템에 대한 모든 비동기 I/O가 끝난 후에 마운트 해제를 다시 실행하십시오.

재부트하면 클러스터 노드가 작동하지 않는 상태가 됨(4664510)

문제점 요약: Sun StorEdge T3 어레이 중 하나의 전원을 끄고 scshutdown 명령을 실행한 다음 두 노드를 재부트하면 클러스터가 작동하지 않는 상태가 됩니다.

해결 방법: 복제의 반이 손실되었으면 다음 단계를 수행합니다.

클러스터가 클러스터 모드인지 확인하십시오.

강제로 디스크 세트를 가져옵니다.
# metaset -s set-name -f -C take

손실된 복제를 삭제합니다.

# metadb -s set-name -fd /dev/did/dsk/dNsX

디스크 세트 사용을 해제하십시오.
# metaset -s set-name -C release
이제 파일 시스템을 마운트하여 사용할 수 있습니다. 그러나 복제의 중복은 복구되지 않았습니다. 복제의 나머지 절반이 손실되면 미러를 정상 상태로 복구할 수 없습니다.

위의 복구 절차를 실행한 후에 데이터베이스를 다시 만드십시오.

디스크 그룹에서 플렉스를 분리할 때 패닉 발생(4657088)

문제점 요약: Sun Cluster의 디스크 그룹에서 플렉스를 분리하거나 제거할 때 다음의 패닉 문자열과 함께 클러스터 노드가 멈출 수 있습니다.

panic[cpu2]/thread=30002901460: BAD TRAP: type=31 rp=2a101b1d200 addr=40 mmu_fsr=0 occurred in module "vxfs" due to a NULL pointer dereference

해결 방법: 디스크 그룹에서 플렉스를 분리하거나 제거하기 전에 해당 파일 시스템의 마운트를 해제하십시오.

라이센스 키를 설치하지 못하는 `scvxinstall -i`(4706175)

문제점 요약: scvxinstall -i 명령어는 -L 옵션이 있는 라이센스 키를 받아들입니다. 그러나 키가 무시되고 설치되지 않습니다.

해결 방법: scvxinstall의 -i 형태로 라이센스 키를 제공하지 마십시오. 키가 설치되지 않습니다. 라이센스 키는 대화식 폼이나 -e 옵션으로 설치해야 합니다. 루트의 캡슐화를 진행하기 전에 라이센스 요구 사항을 검사하고 -e 옵션이나 대화식 폼에서 필요한 키를 제공하십시오.

Siebel 구성 요소를 감시하지 못하는 Sun Cluster HA–Siebel(4722288)

문제점 요약: Sun Cluster HA-Siebel 에이전트는 각 Siebel 구성 요소를 감시하지 않습니다. Siebel 구성 요소의 장애가 감지되면 syslog에 경고 메시지만 기록됩니다.

해결 방법: scswitch -R -h node-g resource_group 명령어를 사용하여 구성 요소가 오프라인인 Siebel 서버 자원 그룹을 다시 시작하십시오.

`remove` 스크립트가 `SUNW.gds` 자원 유형의 등록을 해제하지 못함(4727699)

문제점 요약: remove 스크립트가 SUNW.gds 자원 유형의 등록을 해제하지 못하고 다음과 같은 메시지를 표시합니다.

Resource type has been un-registered already.

해결 방법: remove 스크립트를 사용한 후 SUNW.gds의 등록을 수동으로 해제하십시오. 또는 scsetup 명령어나 SunPlex 관리자를 사용하십시오.

IPMP 그룹 작성 옵션이 `hostname.int`를 덮어씀(4731768)

문제점 요약: SunPlex Manager의 Create IPMP group 옵션은 아직 구성되지 않은 어뎁터와만 사용해야 합니다. 어뎁터가 IP 주소로 이미 구성되었다면 IPMP에 대해 어뎁터를 수동으로 구성해야 합니다.

해결 방법: SunPlex Manager의 Create IPMP group 옵션은 아직 구성되지 않은 어뎁터와만 사용해야 합니다. 어뎁터가 IP 주소로 이미 구성되었다면 Solaris IPMP 관리 도구를 사용하여 어뎁터를 수동으로 구성해야 합니다.

Solaris `shutdown` 명령어를 사용하는 경우 노드 패닉 발생(4745648)

문제점 요약: Solaris shutdown 명령어나 유사한 명령어(예: uadmin )를 사용하여 클러스터 노드를 멈추면 노드 패닉이 발생하고 다음 메시지가 표시될 수 있습니다.

CMM: Shutdown timer expired. Halting.

해결 방법: Sun 고객 서비스 센터로 문의하십시오. 이러한 패닉은 종료되는 노드가 호스팅하고 있던 서비스를 클러스터의 또 다른 노드가 안전하게 넘겨받기 위해 필요합니다.

정족수 장치를 클러스터에 추가하는 관리 명령 실패(4746088)

문제점 요약: 클러스터에 최소의 정족수 개수가 있다면 정족수 장치를 클러스터에 추가하기 위한 관리 명령이 실패하고 다음 메시지가 표시됩니다.

Cluster could lose quorum

해결 방법: Sun 고객 서비스 센터로 문의하십시오.

전용 상호 연결에서 `ce` 어뎁터를 사용할 때 경로 시간 초과(4746175)

문제점 요약: 하나 또는 그 이상의 클러스터 노드에 5개 이상의 프로세스가 있다면 전용 상호 연결에서 ce 어뎁터를 사용하는 클러스터에 경로 시간 초과와 이어서 노드 패닉이 발생할 수 있습니다.

해결 방법: 모든 클러스터 노드에서 /etc/system 파일에 set ce:ce_taskq_disable=1을 추가한 다음 클러스터 노드를 재부트하여 ce 드라이버의 ce_taskq_disable 매개변수를 설정합니다. 이를 통해 인터럽트 컨텍스트에서 하트비트(및 기타 패킷)가 항상 전달되도록 하여 경로 시간와 이어지는 노드 패닉을 방지할 수 있습니다. 클러스터 노드를 재부트하는 동안 정족수 요건을 준수해야 합니다.

독립 네트워크에 장애가 발생할 때 Siebel 게이트웨이 프로브 시간 초과(4764204)

문제점 요약: 공용 네트워크에 장애가 발생하면 Siebel 게이트웨이 프로브에 시간 초과가 발생하여 결국 Siebel 게이트웨이 자원이 오프라인 상태가 될 수 있습니다. Siebel 게이트웨이가 실행되고 있는 노드에 /home으로 시작하는 경로(NFS 및 NIS와 같은 네트워크 자원에 의해 결정)가 있는 경우에 이러한 문제가 발생할 수 있습니다. 공용 네트워크가 없으면 Siebel 게이트웨이 프로브가 /home에서 파일을 열려고 시도하는 동안 정지하게 되어 프로브가 시간 초과하게 됩니다.

해결 방법: Siebel 게이트웨이를 호스트할 수 있는 클러스터의 모든 노드에 대해 다음 단계를 수행합니다.

/etc/nsswitch.conf의 passwd, group 및 project 항목이 nis가 아니라 files만 참조하도록 하십시오.

/home으로 시작하는 어떤 경로에도 NFS나 NIS 종속성이 없도록 하십시오.

로컬로 마운트된 /home 경로를 사용하거나 /home 마운트 지점을 /export/home이나 /home으로 시작하지 않는 다른 경로명으로 변경할 수 있습니다.

/etc/auto_master 파일에서 +auto_master를 포함하는 줄을 주석으로 처리하십시오. 또한 auto_home을 사용하는 모든 /home 항목을 주석으로 처리하십시오.

etc/auto_home에서 +auto_home을 포함하는 줄을 주석으로 처리하십시오.

게이트웨이 경로 소실로 인해 노드 당 논리 IP 통신 두절(4766076)

문제점 요약: 전용 상호 연결을 통해 높은 가용성의 노드 당 논리 IP 통신을 제공하기 위해 Sun Cluster 소프트웨어는 클러스터 노드상의 게이트웨이 경로를 사용합니다. 게이트웨이 경로가 소실되면 노드 당 논리 IP 통신이 두절됩니다.

해결 방법: 뜻하지 않게 소실된 클러스터 노드들을 재부트합니다. 게이트웨이 경로들을 복구하려면 클러스터 노드를 한 번에 하나씩 다시 부트하는 것으로 충분합니다. 노드 당 논리 IP 통신은 경로가 복구될 때까지 두절된 상태로 유지됩니다. 클러스터 노드를 재부트하는 동안 정족수 요건을 준수해야 합니다.

페일오버가 실패하는 경우 오류 발생(4766781)

문제점 요약: 파일 시스템의 페일오버/스위치오버가 성공적이지 못하면 파일 시스템에 오류가 발생할 수 있습니다.

해결 방법: 파일 시스템의 마운트를 해제한 다음 다시 마운트하십시오.

TCP 선택적 승인의 활성화로 인한 데이터 손상(4775631)

문제점 요약: 클러스터 노드에서 TCP 선택적 승인을 사용하면 데이터가 손상될 수 있습니다.

해결 방법: 사용자가 취할 수 있는 해결 방법은 없습니다. 전역 파일 시스템에서 데이터 손상을 피하려면 클러스터 노드에서 TCP 선택적 승인을 다시 활성화하지 마십시오.

일부 데이터 서비스가 지원되지 않는 것으로 잘못 표시하는 `scinstall`(4776411)

문제점 요약: scinstall이 Solaris 9에서 다음 데이터 서비스가 지원되지 않는 것으로 잘못 표시합니다.

SAP용 Sun Cluster HA
SAP liveCache용 Sun Cluster HA

해결 방법: Solaris 8과 9는 SAP용 Sun Cluster HA와 SAP liveCache용 Sun Cluster HA를 모두 지원합니다.scinstall의 지원되지 않는 기능 목록은 무시하십시오.

`/dev/rmt`가 없는 경우 오류가 발생하면서 `scdidadm` 종료(4783135)

문제점 요약: scdidadm(1M)의 현재 구현은 /dev/rmt와 /dev/(r)dsk가 모두 있어야 scdiadm -r을 성공적으로 수행합니다. Solaris는 실제 기본 기억 장치가 있는지에 상관 없이 둘 모두를 설치합니다. /dev/rmt가 없으면 다음 오류가 발생하면서 scdidadm이 종료됩니다.

Cannot walk /dev/rmt" during execution of 'scdidadm -r

해결 방법: /dev/rmt가 없는 노드에서 mkdir을 사용하여 /dev/rmt 디렉토리를 만듭니다. 그런 다음 한 노드에서 scgdevs를 실행합니다.

노드 장애로 클러스터 주 파일 시스템이 다운되는 경우 데이터 손상(4804964)

문제점 요약: 113454-04, 113073-02 및 113276-02 패치(또는 이러한 패치의 일부)를 실행하는 Sun Cluster 3.x 시스템에서 데이터 손상이 발생할 수 있습니다. 이 문제는 전역으로 마운트된 UFS 파일 시스템에서만 발생합니다. 데이터 손상으로 데이터를 잃게 되며(즉, 데이터가 있어야 하는 곳에 0이 있게 됨) 잃어버린 데이터의 양은 항상 디스크 블록의 배수입니다. 클러스터 파일 시스템 클라이언트가 쓰기 작업을 끝낸 또는 끝냈다고 보고한 직후에 노드 장애로 인해 클러스터 주 파일 시스템이 다운될 때 언제라도 데이터가 손실될 수 있습니다. 이러한 데이터 손실에 취약한 기간은 제한적이며 항상 손실되는 것은 아닙니다.

해결 방법: -o syncdir 마운트 옵션을 사용하여 UFS가 동기화된 UFS 로그 트랜잭션을 사용하도록 합니다.

스위치오버하는 동안 노드가 재부트된 후 멈춤(4806621)

문제점 요약: 노드가 클러스터에 합류할 때 장치 그룹 스위치오버가 진행되고 있으면 합류한 노드와 스위치오버 작업이 멈출 수 있습니다. 모든 장치 서비스에 대한 액세스 시도도 모두 멈추게 됩니다. 이러한 현상은 클러스터가 3개 이상의 노드를 가지며 장치에 마운트된 파일 시스템이 VxFS 파일 시스템인 경우에 더 쉽게 발생합니다.

해결 방법: 이를 피하려면 노드가 클러스터에 합류하는 동안은 장치 그룹 스위치오버를 초기화하지 마십시오. 이러한 상황이 발생했으면 모든 클러스터 노드를 재부트하여 장치 그룹에 대한 액세스를 복구해야 합니다.

클러스터 파일 시스템이 가득 찼을 때 파일 시스템 패닉 발생(4808748)

문제점 요약: 클러스터 파일 시스템이 가득 찼을 때 다음 메시지 중 하나가 표시되면서 파일 시스템이 멈추는 경우가 있습니다. 1)

assertion failed: cur_data_token & PXFS_WRITE_TOKEN or PXFS_READ_TOKEN

또는 2)

vp->v_pages == NULL

. These panics are intended to prevent data corruption when a filesystem is full.

해결 방법: 이러한 문제를 줄이려면 되도록 UFS와 함께 클러스터 파일 시스템을 사용하십시오. UFS와 함께 클러스터 파일 시스템을 사용할 때 이러한 패닉이 발생하는 경우는 매우 드물지만 VxFS와 함께 클러스터 파일 시스템을 사용하면 위험이 커집니다.

부트 과정에서 클러스터 노드 멈춤(4809076)

문제점 요약: scswitch -z -D <device-group> -h <node> 명령어를 사용한 장치 서비스 스위치오버 요청이 노드 재부트와 동시에 발생하고 장치 서비스에 구성된 전역 파일 시스템이 있는 경우, 전역 파일 시스템을 사용하지 못하게 될 수 있고 장치 서비스나 전역 파일 시스템이 관여된 이후의 구성 변경도 멈출 수 있습니다. 또한 이후의 클러스터 노드 합류도 멈출 수 있습니다.

해결 방법: 복구를 위해서는 모든 클러스터 노드를 재부트해야 합니다.

`scconf -rq`를 사용하여 정족수 장치를 제거하는 경우 클러스터 패닉 발생(4811232)

문제점 요약: scconf -rq 명령어를 사용하여 취약한 구성에 있는 정족수 장치를 제거하면 다음 메시지와 함께 클러스터의 모든 노드가 멈추게 됩니다.

CMM lost operational quorum

해결 방법: 클러스터에서 정족수 장치를 제거하려면 우선 scstat -q 명령어를 실행하여 출력되는 결과를 점검합니다. 정족수 장치가 Present 열에서 둘 이상의 개수를 갖는 것으로 표시되면 우선 scconf -cq globaldev=QD,maintstate 명령어를 사용하여 이 장치를 관리 모드로 놓아야 합니다. 명령이 완료되고 정족수 장치가 scstat -q에서 0의 개수를 갖는 것으로 표시되면 scconf -rq를 사용하여 장치를 제거할 수 있습니다.

`O_EXCL` 플래그를 사용할 때 이중화된 볼륨에 장애 발생(4820273)

문제점 요약: Solstice DiskSuite/Solaris 볼륨 관리자를 사용하고 있고 O_EXCL 플래그로 이중화된 볼륨이 열려진 경우에 이 볼륨을 포함한 장치 그룹의 페일오버는 실패하게 됩니다. 페일오버 후에 볼륨에 처음으로 액세스할 때 새로운 주 장치 그룹이 멈추게 됩니다.

해결 방법: Solstice DiskSuite/Solaris 볼륨 관리자를 사용할 때 O_EXCL 플래그로 이중화된 볼륨을 열지 마십시오.

스위치오버하는 동안 노드를 재부트하는 경우 클러스터 멈춤(4823195)

문제점 요약: 장치 서비스 페일오버 요청이 노드 재부트나 노드 합류와 동시에 일어나고 장치 서비스에 구성된 클러스터 파일 시스템이 있는 경우, 클러스터 파일 시스템을 사용하지 못하게 될 수 있고 장치 서비스나 전역 파일 시스템이 관여된 이후의 구성 변경도 멈출 수 있습니다. 또한 이후의 클러스터 노드 합류도 멈출 수 있습니다.

해결 방법: 복구하려면 모든 클러스터 노드들을 재부트해야 합니다.

프랑스어 로켈의 번역되지 않은 텍스트(4840085)

문제점 요약: Sun Plex Manager를 사용하여 프랑스어 로켈로 Sun Cluster를 설치할 때 일부 번역되지 않은 텍스트가 나타납니다.

해결 방법: 이 오류는 SunPlex Manager의 기능에 아무 영향을 미치지 않습니다. 번역되지 않은 텍스트를 무시하거나 브라우저 언어를 영어로 설정하여 번역이 섞이는 것을 피할 수 있습니다.