내부 출처

Oracle AI Data Platform Workbench는 내장된 수집 커넥터를 사용하여 내부 Oracle 소스로부터의 수집을 지원합니다. 이러한 커넥터를 통해 사용자는 Spark 기반 노트북을 사용하여 데이터를 원활하게 추출하고 워크플로우 및 데이터 파이프라인에 통합할 수 있습니다.

수집 커넥터는 연결 설정의 복잡성을 추상화하여 Oracle-native 서비스에서 배치 및 거의 실시간 수집을 위한 최적화된 액세스 패턴을 제공합니다.

AI Data Platform Workbench는 Oracle AI Data Platform Workbench Samples Git 저장소에 샘플 코드 템플릿을 제공하여 노트북에 Spark를 사용하여 여러 내부 소스의 데이터 수집을 지원합니다.

표 14-1 내부 소스

소스 액세스 유형 통합 방법 설명 외부 카탈로그 지원 샘플 코드 사용 가능
Fusion 추출만 사전 구성된 Spark 템플리트 BICC를 통해 Fusion SaaS 애플리케이션의 데이터를 AI 데이터 플랫폼 워크벤치 테이블 또는 볼륨으로 추출합니다. 아니요
REST 끝점 읽기 전용 Spark 노트북을 통한 JDBC JSON과 같은 반구조적 데이터를 수집하기 위해 API에서 읽습니다. 아니요
MySQL HeatWave 읽기 전용 Spark 노트북을 통한 JDBC JDBC를 사용하여 AI 데이터 플랫폼 워크벤치와 MySQL HeatWave 간에 데이터를 이동합니다. 아니요
Oracle Autonomous AI Lakehouse 읽기/쓰기 + 무복사 JDBC 또는 외부 카탈로그 중복 없이 직접 데이터를 쿼리하기 위해 Oracle Autonomous AI Lakehouse에서 수집하거나 외부 카탈로그로 등록합니다.
Oracle Autonomous AI Transaction Processing 읽기/쓰기 + 무복사 JDBC 또는 외부 카탈로그 중복 없이 직접 데이터를 Query하기 위해 외부 카탈로그에서 수집하거나 외부 카탈로그로 등록합니다.
Oracle Database 읽기/쓰기 JDBC 또는 외부 카탈로그 온프레미스 또는 OCI 데이터베이스에서 데이터 수집을 지원합니다.
Exadata 읽기/쓰기 JDBC 또는 외부 카탈로그 JDBC를 사용하여 고성능 읽기 및 쓰기를 수행할 수 있도록 Exadata 시스템에 액세스합니다. 아니요

표 14-2 Spark SQL - Oracle Autonomous AI Database, Exadata 데이터 유형 매핑

Spark SQL 유형 Oracle AI Database, Oracle Autonomous AI Database, Exadata 데이터 유형
바이트 유형 번호(38,10)
짧은 유형 번호(38,10)
IntegerType(INT) 번호(38,10)
긴 유형 번호(38,10)
유동 유형 FLOAT(126)
이중 유형 번호(38,10)
DecimalType(p,s) 숫자(p,s)
문자열 유형 VARCHAR2(4000 CHAR)
바이너리 유형 BLOB
부울 유형 VARCHAR2(4000 CHAR)
일자 유형 DATE
시간 기록 유형 TIMESTAMP(6)
배열 유형 VARCHAR2(4000 CHAR)
맵 유형 지원되지 않음
구조 유형 VARCHAR2(4000 CHAR)
달력 간격 유형 String/VARCHAR2로 변환될 경우 지원됨