자율운영 AI 트랜잭션 처리에서 Apache Iceberg로 데이터 복제
Autonomous AI Transaction Processing에서 OCI GoldenGate의 Apache Iceberg로 데이터를 복제하는 방법을 확인해 보세요.
시작하기 전에
이 빠른 시작을 성공적으로 완료하려면 다음이 있어야 합니다.
-
소스 자율운영 AI 트랜잭션 처리
-
대상 Apache Iceberg 환경:
-
OCI GoldenGate는 Apache Iceberg 테이블용 스토리지 서비스로서 Azure Data Lake Storage, Amazon S3, Google Cloud Storage를 지원합니다.
-
OCI GoldenGate는 Apache Iceberg용 Hadoop, Nessie, AWS Glue, Polaris, REST 및 JDBC 카탈로그를 지원합니다.
-
환경 설정: 자율운영 AI 트랜잭션 처리
복제를 위해 소스 데이터베이스가 아직 설정되지 않은 경우 다음 단계에 따라 이 빠른 시작에 사용할 샘플 스키마를 로드할 수 있습니다. 이 빠른 시작은 소스 데이터베이스에 자율운영 AI 트랜잭션 처리를 사용합니다.
소스 자율운영 AI 트랜잭션 처리를 설정하려면 다음과 같이 하십시오.
-
샘플 데이터베이스 스키마를 다운로드하고 압축을 풉니다.
-
Oracle Cloud 콘솔의 자율운영 AI 데이터베이스 페이지에서 자율운영 AI 트랜잭션 처리(ATP) 인스턴스를 선택하여 세부정보를 확인하고 Database Actions에 액세스합니다.
-
GGADMIN 유저의 잠금을 해제합니다.
-
데이터베이스 작업을 선택한 다음 데이터베이스 사용자를 선택합니다.
-
GGADMIN을 찾은 다음 줄임표 메뉴(점 3개)를 선택하고 Edit(편집)를 선택합니다.
-
Edit User 패널에서 GGADMIN 암호를 입력하고 암호를 확인한 다음 Account is Locked의 선택을 해제합니다.
-
변경 사항 적용을 선택합니다.
-
-
소스 샘플 스키마 및 데이터를 로드합니다.
-
[데이터베이스 작업] 메뉴의 [개발]에서 SQL을 선택합니다.
-
OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql에서 스크립트를 복사하여 SQL Worksheet에 붙여 넣습니다. -
스크립트 실행을 선택합니다. Script Output 탭에 확인 메시지가 표시됩니다.
-
SQL Worksheet를 지운 다음
OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.에서 SQL 스크립트를 복사하여 붙여 넣습니다.참고: SQL 도구가 스크립트를 성공적으로 실행하려면 각 명령문을 별도로 실행해야 할 수 있습니다.
-
테이블이 성공적으로 생성되었는지 확인하려면 SQL window를 닫고 다시 여십시오. Navigator 탭에서
SRC_OCIGGLL스키마를 찾은 다음 해당 드롭다운에서 테이블을 선택합니다.
-
-
보완 로깅 활성화:
-
SQL Worksheet를 지웁니다.
-
다음 명령문을 입력한 다음 명령문 실행을 선택합니다.
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
-
작업 1: 리소스 생성
이 빠른 시작 예에서는 소스 및 대상에 대한 배치 및 접속이 필요합니다.
-
소스 자율운영 AI 트랜잭션 처리(ATP) 인스턴스에 대한 Oracle 배치를 생성합니다.
-
Apache Iceberg 대상에 대한 빅데이터 배포를 생성합니다.
태스크 2: 추출 추가
-
배치 페이지에서 소스 자율운영 AI 트랜잭션 처리(ATP) 배치를 선택합니다.
-
배포 세부정보 페이지에서 콘솔 실행을 선택합니다.
-
소스 배포의 관리자 사용자 이름 및 비밀번호로 로그인합니다.
작업 3: 배포 경로 추가 및 실행
-
GoldenGate 인증서 저장소를 사용하는 경우 대상 Big Data 배치에서 배포 경로에 대한 사용자를 생성하고, 그렇지 않은 경우 3단계로 건너뜁니다.
-
소스 GoldenGate 배치 콘솔에서 1단계에서 생성한 사용자에 대한 경로 접속을 추가합니다.
-
소스 GoldenGate 배치 콘솔의 왼쪽 탐색에서 경로 접속을 선택합니다.
-
Add Path Connection(더하기 아이콘)을 선택한 후 다음을 완료합니다.
-
자격 증명 별칭에
GGSNetwork을 입력합니다. -
사용자 ID의 경우 1단계에서 만든 사용자의 이름을 입력합니다.
-
확인을 위해 사용자 암호를 두 번 입력합니다.
-
-
제출을 선택합니다.
경로 연결이 경로 연결 목록에 나타납니다.
-
-
source 배치 콘솔에서 다음 값을 사용하여 배포 경로를 추가합니다.
-
소스 옵션 페이지에서 다음을 수행합니다.
-
소스 추출의 경우 태스크 2에서 생성된 추출을 선택합니다.
-
트레일 이름에 2자 이름(예:
E1)을 입력합니다.
-
-
대상 옵션 페이지에서 다음을 수행합니다.
-
대상 호스트에 대상 배치의 호스트 도메인을 입력합니다.
-
포트 번호에서
443을 입력합니다. -
트레일 이름에 2자 이름(예:
E1)을 입력합니다. -
별칭의 경우 단계 2에서 생성된 인증서 별칭을 입력합니다.
-
-
-
대상 Big Data 배치 콘솔에서 배포 경로의 결과로 생성된 수신기 경로를 검토합니다.
-
대상 Big Data 배치 콘솔에서 수신기 서비스를 선택합니다.
-
경로 세부정보를 검토합니다. 이 경로는 이전 단계에서 생성된 배포 경로의 결과로 생성되었습니다.
-
작업 4: Replicat 추가 및 실행
Replicat를 추가하고 실행하려면 다음과 같이 하십시오.
-
대상 Big Data 배치 콘솔 탐색 메뉴에서 복제, 복제 추가(플러스 아이콘) 순으로 선택합니다.
-
[복제 추가] 패널의 복제 정보 페이지에서 필요에 따라 필드에 정보를 입력한 다음 다음을 선택합니다.
-
복제 유형에 대해 클래식 복제를 선택합니다.
-
프로세스 이름을 5자 이하로 입력합니다.
-
이 프로세스를 다른 프로세스와 구별하는 데 도움이 되도록 설명을 입력합니다.
-
-
복제 옵션 페이지에서 필요에 따라 필드에 정보를 입력한 다음 다음을 선택합니다.
-
복제 추적에 추출 추적 이름을 입력합니다.
-
대상의 경우 Apache Iceberg를 선택합니다.
-
형식에 대해 Apache Iceberg에 수집할 형식을 선택합니다. 기본값은 Parquet입니다.
-
사용 가능한 별칭의 경우 드롭다운에서 Apache Iceberg 접속을 선택합니다.
-
-
[관리 옵션] 페이지에서 기본 설정을 그대로 두고 다음을 선택합니다.
-
[복제 매개변수] 페이지에서 기본 설정을 그대로 두고 다음을 선택합니다.
-
[복제 속성] 페이지에서 TODO로 표시된 필드를 업데이트한 다음 생성 및 실행을 선택합니다.
자세한 내용은 Apache Iceberg 대상 세부정보를 참조하십시오.
작업 5: 복제 확인
복제를 확인하려면 출처 ATP 인스턴스에 대한 업데이트를 수행합니다.
-
Oracle Cloud 콘솔에서 탐색 메뉴를 열고 Oracle AI Database를 선택한 다음 Autonomous AI Transaction Processing을 선택합니다.
-
자율운영 AI 트랜잭션 처리(ATP) 인스턴스 목록에서 소스 인스턴스를 선택하여 세부정보를 확인합니다.
-
데이터베이스 세부정보 페이지에서 데이터베이스 작업을 선택합니다.
주: 자동으로 로그인해야 합니다. 그렇지 않은 경우 데이터베이스 인증서로 로그인합니다.
-
데이터베이스 작업 홈 페이지에서 SQL을 선택합니다.
-
워크시트에 다음을 입력하고 스크립트 실행을 선택합니다.
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002); -
소스 ATP 배치 콘솔에서 추출 이름을 선택한 다음 통계를 선택합니다. SRC_OCIGGLL.SRC_CITY에 10개의 삽입이 있는지 확인합니다.
-
대상 Big Data OCI GoldenGate 배치 콘솔에서 Replicat 이름을 선택한 다음 통계를 선택합니다. SRC_OCIGGLL.SRC_CITY에 10개의 삽입이 있는지 확인합니다.
-
Oracle Cloud 콘솔에서 Oracle Object Storage 버킷으로 이동하여 해당 콘텐츠를 확인합니다.