자율운영 AI 트랜잭션 처리에서 Apache Iceberg로 데이터 복제

Autonomous AI Transaction Processing에서 OCI GoldenGate의 Apache Iceberg로 데이터를 복제하는 방법을 확인해 보세요.

시작하기 전에

이 빠른 시작을 성공적으로 완료하려면 다음이 있어야 합니다.

소스 자율운영 AI 트랜잭션 처리
대상 Apache Iceberg 환경:
- OCI GoldenGate는 Apache Iceberg 테이블용 스토리지 서비스로서 Azure Data Lake Storage, Amazon S3, Google Cloud Storage를 지원합니다.
- OCI GoldenGate는 Apache Iceberg용 Hadoop, Nessie, AWS Glue, Polaris, REST 및 JDBC 카탈로그를 지원합니다.

환경 설정: 자율운영 AI 트랜잭션 처리

복제를 위해 소스 데이터베이스가 아직 설정되지 않은 경우 다음 단계에 따라 이 빠른 시작에 사용할 샘플 스키마를 로드할 수 있습니다. 이 빠른 시작은 소스 데이터베이스에 자율운영 AI 트랜잭션 처리를 사용합니다.

소스 자율운영 AI 트랜잭션 처리를 설정하려면 다음과 같이 하십시오.

샘플 데이터베이스 스키마를 다운로드하고 압축을 풉니다.
Oracle Cloud 콘솔의 자율운영 AI 데이터베이스 페이지에서 자율운영 AI 트랜잭션 처리(ATP) 인스턴스를 선택하여 세부정보를 확인하고 Database Actions에 액세스합니다.
GGADMIN 유저의 잠금을 해제합니다.
1. 데이터베이스 작업을 선택한 다음 데이터베이스 사용자를 선택합니다.
2. GGADMIN을 찾은 다음 줄임표 메뉴(점 3개)를 선택하고 Edit(편집)를 선택합니다.
3. Edit User 패널에서 GGADMIN 암호를 입력하고 암호를 확인한 다음 Account is Locked의 선택을 해제합니다.
4. 변경 사항 적용을 선택합니다.
소스 샘플 스키마 및 데이터를 로드합니다.
1. [데이터베이스 작업] 메뉴의 [개발]에서 SQL을 선택합니다.
2. OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql에서 스크립트를 복사하여 SQL Worksheet에 붙여 넣습니다.
3. 스크립트 실행을 선택합니다. Script Output 탭에 확인 메시지가 표시됩니다.
4. SQL Worksheet를 지운 다음 OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.에서 SQL 스크립트를 복사하여 붙여 넣습니다.
  
  참고: SQL 도구가 스크립트를 성공적으로 실행하려면 각 명령문을 별도로 실행해야 할 수 있습니다.
5. 테이블이 성공적으로 생성되었는지 확인하려면 SQL window를 닫고 다시 여십시오. Navigator 탭에서 SRC_OCIGGLL 스키마를 찾은 다음 해당 드롭다운에서 테이블을 선택합니다.
보완 로깅 활성화:
1. SQL Worksheet를 지웁니다.
2. 다음 명령문을 입력한 다음 명령문 실행을 선택합니다.
```
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
```

작업 1: 리소스 생성

이 빠른 시작 예에서는 소스 및 대상에 대한 배치 및 접속이 필요합니다.

소스 자율운영 AI 트랜잭션 처리(ATP) 인스턴스에 대한 Oracle 배치를 생성합니다.
Apache Iceberg 대상에 대한 빅데이터 배포를 생성합니다.
자율운영 AI 트랜잭션 처리(ATP) 접속을 생성합니다.
Apache Iceberg 접속을 생성합니다.
GoldenGate 서버 접속을 생성하고 Oracle 배치에 지정합니다.
Oracle 배치에 자율운영 AI 트랜잭션 처리(ATP) 접속을 지정합니다.
빅데이터 배포에 Apache Iceberg 연결을 지정합니다.

태스크 2: 추출 추가

배치 페이지에서 소스 자율운영 AI 트랜잭션 처리(ATP) 배치를 선택합니다.
배포 세부정보 페이지에서 콘솔 실행을 선택합니다.
소스 배포의 관리자 사용자 이름 및 비밀번호로 로그인합니다.
추출 추가.

작업 3: 배포 경로 추가 및 실행

GoldenGate 인증서 저장소를 사용하는 경우 대상 Big Data 배치에서 배포 경로에 대한 사용자를 생성하고, 그렇지 않은 경우 3단계로 건너뜁니다.
소스 GoldenGate 배치 콘솔에서 1단계에서 생성한 사용자에 대한 경로 접속을 추가합니다.
1. 소스 GoldenGate 배치 콘솔의 왼쪽 탐색에서 경로 접속을 선택합니다.
2. Add Path Connection(더하기 아이콘)을 선택한 후 다음을 완료합니다.
  1. 자격 증명 별칭에 GGSNetwork을 입력합니다.
  2. 사용자 ID의 경우 1단계에서 만든 사용자의 이름을 입력합니다.
  3. 확인을 위해 사용자 암호를 두 번 입력합니다.
3. 제출을 선택합니다.
  
  경로 연결이 경로 연결 목록에 나타납니다.
source 배치 콘솔에서 다음 값을 사용하여 배포 경로를 추가합니다.
1. 소스 옵션 페이지에서 다음을 수행합니다.
  - 소스 추출의 경우 태스크 2에서 생성된 추출을 선택합니다.
  - 트레일 이름에 2자 이름(예: E1)을 입력합니다.
2. 대상 옵션 페이지에서 다음을 수행합니다.
  - 대상 호스트에 대상 배치의 호스트 도메인을 입력합니다.
  - 포트 번호에서 443을 입력합니다.
  - 트레일 이름에 2자 이름(예: E1)을 입력합니다.
  - 별칭의 경우 단계 2에서 생성된 인증서 별칭을 입력합니다.
대상 Big Data 배치 콘솔에서 배포 경로의 결과로 생성된 수신기 경로를 검토합니다.
1. 대상 Big Data 배치 콘솔에서 수신기 서비스를 선택합니다.
2. 경로 세부정보를 검토합니다. 이 경로는 이전 단계에서 생성된 배포 경로의 결과로 생성되었습니다.

작업 4: Replicat 추가 및 실행

Replicat를 추가하고 실행하려면 다음과 같이 하십시오.

대상 Big Data 배치 콘솔 탐색 메뉴에서 복제, 복제 추가(플러스 아이콘) 순으로 선택합니다.
[복제 추가] 패널의 복제 정보 페이지에서 필요에 따라 필드에 정보를 입력한 다음 다음을 선택합니다.
- 복제 유형에 대해 클래식 복제를 선택합니다.
- 프로세스 이름을 5자 이하로 입력합니다.
- 이 프로세스를 다른 프로세스와 구별하는 데 도움이 되도록 설명을 입력합니다.
복제 옵션 페이지에서 필요에 따라 필드에 정보를 입력한 다음 다음을 선택합니다.
1. 복제 추적에 추출 추적 이름을 입력합니다.
2. 대상의 경우 Apache Iceberg를 선택합니다.
3. 형식에 대해 Apache Iceberg에 수집할 형식을 선택합니다. 기본값은 Parquet입니다.
4. 사용 가능한 별칭의 경우 드롭다운에서 Apache Iceberg 접속을 선택합니다.
[관리 옵션] 페이지에서 기본 설정을 그대로 두고 다음을 선택합니다.
[복제 매개변수] 페이지에서 기본 설정을 그대로 두고 다음을 선택합니다.
[복제 속성] 페이지에서 TODO로 표시된 필드를 업데이트한 다음 생성 및 실행을 선택합니다.

자세한 내용은 Apache Iceberg 대상 세부정보를 참조하십시오.

작업 5: 복제 확인

복제를 확인하려면 출처 ATP 인스턴스에 대한 업데이트를 수행합니다.

Oracle Cloud 콘솔에서 탐색 메뉴를 열고 Oracle AI Database를 선택한 다음 Autonomous AI Transaction Processing을 선택합니다.
자율운영 AI 트랜잭션 처리(ATP) 인스턴스 목록에서 소스 인스턴스를 선택하여 세부정보를 확인합니다.
데이터베이스 세부정보 페이지에서 데이터베이스 작업을 선택합니다.

주: 자동으로 로그인해야 합니다. 그렇지 않은 경우 데이터베이스 인증서로 로그인합니다.
데이터베이스 작업 홈 페이지에서 SQL을 선택합니다.

워크시트에 다음을 입력하고 스크립트 실행을 선택합니다.

Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);

소스 ATP 배치 콘솔에서 추출 이름을 선택한 다음 통계를 선택합니다. SRC_OCIGGLL.SRC_CITY에 10개의 삽입이 있는지 확인합니다.
대상 Big Data OCI GoldenGate 배치 콘솔에서 Replicat 이름을 선택한 다음 통계를 선택합니다. SRC_OCIGGLL.SRC_CITY에 10개의 삽입이 있는지 확인합니다.
Oracle Cloud 콘솔에서 Oracle Object Storage 버킷으로 이동하여 해당 콘텐츠를 확인합니다.