II부 데이터 관리
Oracle AI Data Platform Workbench를 사용하면 OCI Object Storage 및 Autonomous Database, Kafka 등의 기타 외부 소스 전반에서 모든 데이터 및 메타데이터를 효과적으로 관리할 수 있습니다. 데이터 자산 전반에 걸쳐 중앙화된 메타데이터를 제공하고 기업이 정형, 반구조적 및 비구조적 데이터에 대한 통합 액세스 제어를 정의할 수 있도록 합니다.
AI 데이터 플랫폼 워크벤치는 기업이 데이터 관리 사용 사례를 원활하게 해결할 수 있도록 지원합니다. 다양한 인물이 비즈니스 리더에게 가치를 제공하기 위해 조직에서 협력합니다.
- 데이터 관리인은 데이터 자산 및 엔티티를 검색하여 데이터의 위치, 데이터의 구조화 및 사용 방식을 이해함으로써 데이터/메타데이터 수명 주기를 효과적으로 관리해야 합니다.
- 데이터 관리자는 카탈로그, 스키마, 테이블 및 볼륨에서 데이터를 구성하여 효율적이고 안전한 데이터 저장, 구성 및 검색을 보장합니다.
- 데이터 엔지니어 및 분석가는 데이터의 진정한 가치를 실현하기 위해 다른 분석가 또는 비즈니스 리더와 데이터를 공유해야 합니다.
데이터 검색
다음을 사용하여 AI 데이터 플랫폼 워크벤치의 모든 데이터 자산을 원활하게 검색할 수 있습니다.
- 마스터 카탈로그 탐색기
- 노트북, sql/python 파일로 작업하는 동안 작업 영역의 카탈로그 탐색기
- SHOW, LIST 및 DESCRIBE와 같은 SQL 문법
- API
데이터 구성
카탈로그, 스키마, 테이블, 볼륨에서 데이터를 구성할 수 있습니다.
- 표준 카탈로그: 표준 카탈로그는 스키마(데이터베이스)의 논리적 컨테이너로, 사용자가 스키마에서 테이블, 뷰 및 볼륨을 생성할 수 있습니다. 표준 카탈로그는 모든 하위 객체의 메타데이터 수명 주기를 관리합니다.
- 외부 카탈로그: 외부 카탈로그는 Autonomous Database와 같은 외부 데이터 소스에 의해 지원됩니다. 외부 카탈로그의 경우 메타데이터만 외부 소스에서 동기화되고 사용자는 catalog_name.schema.name.table_name과 같은 세 부분으로 구성된 이름을 사용하여 외부 소스에 상주하는 데이터를 질의할 수 있습니다. 외부 카탈로그의 경우 메타데이터 수명 주기는 외부 소스에서 관리되고 마스터 카탈로그는 메타데이터 복사본을 유지합니다. 외부 카탈로그는 외부 소스에서 메타데이터만 수집하며 데이터는 AI 데이터 플랫폼으로 복사되지 않습니다.
다음을 생성하여 AI 데이터 플랫폼 워크벤치가 메타데이터 수명 주기를 관리하도록 선택할 수 있습니다.
- External Table: 테이블, 해당 스키마를 정의하고 OCI Object Storage의 위치를 참조하거나
- 외부 볼륨: OCI Object Storage의 위치를 참조하는 볼륨을 정의한 다음 볼륨에 파일 및 폴더를 추가로 저장
또한 다음을 생성하여 AI 데이터 플랫폼 워크벤치가 데이터 및 메타데이터 수명 주기를 관리하도록 선택할 수 있습니다.
- 관리형 테이블 및 AI Data Platform Workbench, 고객의 테넌시에서 OCI Object Storage 위치 관리
- 관리형 볼륨 및 AI 데이터 플랫폼 워크벤치는 고객의 테넌시에서 OCI Object Storage 위치를 관리하여 사용자가 파일 및 폴더(반구조적 또는 비구조적 데이터)를 볼륨에 저장할 수 있도록 합니다.
데이터 공유
AI 데이터 플랫폼 워크벤치의 데이터 공유를 통해 사용자는 조직 및 조직 외부의 사용자와 데이터 자산을 공유할 수 있습니다. AI 데이터 플랫폼 워크벤치의 데이터 공유는 오픈 소스 델타 공유 프로토콜을 기반으로 구축되며 데이터가 안전한 방식으로 공유되도록 하기 위해 수신자를 공유하고 생성할 수 있는 사용자에 대한 권한을 적용할 수 있습니다.
자동 채우기
자동 채우기 기능은 선택한 표준 카탈로그에서 데이터 엔티티를 자동으로 감지하고 생성하여 메타데이터 관리를 단순화합니다. 이 기능은 사용자가 OCI Object Storage의 데이터 위치를 가리켜 메타데이터 추출기를 생성할 수 있도록 함으로써 대량의 테이블을 수동으로 생성하는 프로세스를 자동화합니다.