자율운영 AI 트랜잭션 처리에서 Apache Iceberg로 데이터 복제

시작하기 전에

이 빠른 시작을 성공적으로 완료하려면 다음이 있어야 합니다.

소스 자율운영 AI 트랜잭션 처리(ATP)
대상 Apache Iceberg 환경:
- OCI GoldenGate은 Azure Data Lake Storage, Amazon S3, Google Cloud Storage를 Apache Iceberg 테이블의 스토리지 서비스로 지원합니다.
- OCI GoldenGate는 Apache Iceberg용 Hadoop, Nessie, AWS Glue, Polaris, REST 및 JDBC 카탈로그를 지원합니다.

환경 설정: 자율운영 AI 트랜잭션 처리(ATP)

복제를 위해 소스 데이터베이스가 아직 설정되지 않은 경우 다음 단계에 따라 이 빠른 시작에 사용할 샘플 스키마를 로드할 수 있습니다. 이 빠른 시작은 소스 데이터베이스에 자율운영 AI 트랜잭션 처리(ATP)를 사용합니다.

소스 자율운영 AI 트랜잭션 처리를 설정하려면 다음을 수행합니다.

샘플 데이터베이스 스키마를 다운로드하고 압축을 풉니다.
Oracle Cloud 콘솔의 자율운영 AI 데이터베이스 페이지에서 자율운영 AI 트랜잭션 처리(ATP) 인스턴스를 선택하여 세부정보를 확인하고 Database Actions에 액세스합니다.
GGADMIN 유저의 잠금을 해제합니다.
1. 데이터베이스 작업을 누른 다음 데이터베이스 사용자를 누릅니다.
2. GGADMIN을 찾은 다음 줄임표 메뉴(점 3개)를 누르고 편집을 선택합니다.
3. [사용자 편집] 패널에서 GGADMIN 비밀번호를 입력하고 비밀번호를 확인한 다음 계정이 잠겨 있습니다의 선택을 해제합니다.
4. 변경사항 적용을 누릅니다.
소스 샘플 스키마 및 데이터를 로드합니다.
1. 데이터베이스 작업 메뉴의 [개발]에서 SQL을 선택합니다.
2. OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql에서 스크립트를 복사하여 SQL Worksheet에 붙여 넣습니다.
3. 스크립트 실행을 누르십시오. [스크립트 출력] 탭에 확인 메시지가 표시됩니다.
4. SQL Worksheet를 지운 다음 OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.에서 SQL 스크립트를 복사하여 붙여 넣습니다.
  
  참고:
  SQL 도구가 스크립트를 성공적으로 실행하려면 각 명령문을 별도로 실행해야 할 수도 있습니다.
5. 테이블이 성공적으로 생성되었는지 확인하려면 SQL 창을 닫고 다시 엽니다. 네비게이터 탭에서 SRC_OCIGGLL 스키마를 찾은 다음 해당 드롭다운에서 테이블을 선택합니다.
보완 로깅 활성화:
1. SQL Worksheet를 지웁니다.
2. 다음 명령문을 입력한 후 명령문 실행을 누릅니다.
```
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
```

작업 1: 리소스 생성

이 빠른 시작 예에서는 소스 및 대상에 대한 배치 및 접속이 필요합니다.

소스 자율운영 AI 트랜잭션 처리(ATP) 인스턴스에 대한 Oracle 배치를 생성합니다.
Apache Iceberg 대상에 대한 빅데이터 배포를 생성합니다.
Autonomous Transaction Processing 접속을 생성합니다.
Apache Iceberg 접속을 생성합니다.
GoldenGate 서버 접속을 생성하고 Oracle 배치에 지정합니다.
Oracle 배치에 ATP 접속을 지정합니다.
Big Data 배치에 Iceberg 접속을 지정합니다.

작업 2: Extract 추가

배치 페이지에서 소스 자율운영 AI 트랜잭션 처리(ATP) 배치를 선택합니다.
배치 세부정보 페이지에서 콘솔 실행을 누릅니다.
소스 배포의 관리자 사용자 이름 및 비밀번호로 로그인합니다.
거래 정보를 추가합니다.
Extract을 추가합니다.

작업 3: Distribution Path 추가 및 실행

GoldenGate 인증서 저장소를 사용하는 경우 대상 Big Data 배치에서 배포 경로에 대한 사용자를 생성하고, 그렇지 않은 경우 3단계로 건너뜁니다.
소스 ATP GoldenGate 배치 콘솔에서 1단계에서 생성한 사용자에 대한 경로 접속을 추가합니다.
1. 소스 ATP GoldenGate 배치 콘솔의 왼쪽 탐색에서 경로 접속을 누릅니다.
2. Add Path Connection(경로 연결 추가)(더하기 아이콘)을 누르고 다음을 완료합니다.
  1. 자격 증명 별칭에 GGSNetwork을 입력합니다.
  2. 사용자 ID에 대해 1단계에서 만든 사용자의 이름을 입력합니다.
  3. 확인을 위해 사용자 암호를 두 번 입력합니다.
3. 제출을 누릅니다.
  
  경로 연결이 경로 연결 목록에 나타납니다.
소스 ATP 배치 콘솔에서 다음 값을 사용하여 배포 경로를 추가합니다.
1. 소스 옵션 페이지에서 다음을 수행합니다.
  - 소스 추출의 경우 태스크 2에서 생성된 추출을 선택합니다.
  - 트레일 이름에 2자 이름(예: E1)을 입력합니다.
2. 대상 옵션 페이지에서 다음을 수행합니다.
  - 대상 호스트에 대상 배치의 호스트 도메인을 입력합니다.
  - 포트 번호에서 443을 입력합니다.
  - 트레일 이름에 2자 이름(예: E1)을 입력합니다.
  - 별칭의 경우 2단계에서 만든 자격 증명 별칭을 입력합니다.
대상 Big Data 배치 콘솔에서 Distribution Path의 결과로 생성된 Receiver Path를 검토합니다.
1. 대상 Big Data 배치 콘솔에서 Receiver Service을 누릅니다.
2. 경로 세부 사항을 검토합니다. 이 경로는 이전 단계에서 생성된 Distribution Path의 결과로 생성되었습니다.

작업 4: Replicat 추가 및 실행

Replicat를 추가하고 실행하려면 다음과 같이 하십시오.

OCI GoldenGate 배치 콘솔의 관리 서비스 홈 페이지에서 복제 추가(더하기 아이콘)를 누릅니다.
복제 항목 추가 패널의 복제 항목 정보 페이지에서 필요에 따라 필드에 정보를 입력한 후 다음을 누릅니다.
- 복제 유형에 대해 클래식 복제를 선택합니다.
- 프로세스 이름을 5자 이하로 입력합니다.
- 이 프로세스를 다른 프로세스와 구별하는 데 도움이 되도록 설명을 입력합니다.
복제 옵션 페이지에서 필요에 따라 필드에 정보를 입력한 후 다음을 누릅니다.
1. 복제 추적에 대해 추출 추적 이름을 입력합니다.
2. 대상의 경우 Apache Iceberg를 선택합니다.
3. 형식의 경우 Apache Iceberg에 수집할 형식을 선택합니다. 기본값은 Parquet입니다.
4. 사용 가능한 별칭의 경우 드롭다운에서 Apache Iceberg 접속을 선택합니다.
[관리 옵션] 페이지에서 기본 설정을 그대로 두고 다음을 누릅니다.
복제 매개변수 페이지에서 기본 설정을 그대로 두고 다음을 누릅니다.
복제 속성 페이지에서 TODO로 표시된 필드를 업데이트한 다음 생성 및 실행을 누릅니다.
자세한 내용은 Apache Iceberg 대상 세부정보를 참조하십시오.

작업 5: 복제 확인

복제를 확인하려면 출처 ATP 인스턴스에 대한 업데이트를 수행합니다.

Oracle Cloud 콘솔에서 탐색 메뉴를 열고 Oracle Database를 선택한 다음 Autonomous Database를 선택합니다.
자율운영 데이터베이스 목록에서 소스 인스턴스를 선택하여 세부정보를 봅니다.
데이터베이스 세부정보 페이지에서 데이터베이스 작업을 누릅니다.
데이터베이스 작업 페이지에서 SQL을 선택합니다.

SQL 워크시트에 다음 insert 문을 입력한 후 스크립트 실행을 누릅니다.

Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);

소스 ATP 배치 콘솔에서 추출 이름을 선택한 다음 통계를 누릅니다. SRC_OCIGGLL.SRC_CITY에 10개의 삽입이 있는지 확인합니다.
대상 Big Data 배치 콘솔에서 Replicat 이름을 선택한 다음 통계를 누릅니다. SRC_OCIGGLL.SRC_CITY에 10개의 삽입이 있는지 확인합니다.