3 Oracle AI Data Platform Workbench의 특징
Oracle AI Data Platform Workbench는 대규모 데이터 수집, 처리, 분석을 간소화하도록 설계된 모던 데이터 플랫폼입니다. 컴퓨팅, 스토리지 및 카탈로그 기능을 원활하게 통합하여 효율적인 데이터 관리를 지원합니다.
AI Data Platform Workbench의 주요 기능은 다음과 같습니다.
작업영역
AI 데이터 플랫폼 워크벤치의 작업영역은 사용자가 워크플로, 노트북, 라이브러리를 비롯한 데이터 레이크 리소스를 관리하고 구성할 수 있는 격리된 환경 역할을 합니다. 작업영역은 리소스를 논리적으로 그룹화하여 효율적인 협업 및 거버넌스를 가능하게 합니다.
컴퓨트
AI Data Platform Workbench는 데이터 처리 및 분석 워크로드 실행을 위한 확장 가능한 CPU 및 GPU 컴퓨트 리소스를 제공합니다. 사용자는 Spark 기반 실행 환경을 활용하여 일괄 처리 및 대화식 워크로드를 지원하는 고성능 처리를 수행할 수 있습니다.
노트북
AI 데이터 플랫폼 워크벤치에는 코드 작성 및 실행을 위한 대화형 개발 환경으로 노트북이 포함되어 있습니다. Python 및 SparkSQL을 지원하므로 사용자가 AI 데이터 플랫폼 내에서 직접 데이터를 변환, 분석 및 시각화할 수 있습니다.
워크플로우
워크플로우 구성요소를 통해 사용자는 노트북, Python 작업, if-else 및 기타 작업으로 구성된 데이터 파이프라인을 정의하고 조정할 수 있습니다. 사용자는 ETL, 데이터 변환 및 분석 자동화를 위한 워크플로우를 생성, 스케줄링 및 모니터링할 수 있습니다.
마스터 카탈로그
마스터 카탈로그는 AI 데이터 플랫폼 워크벤치 내의 모든 정형 및 비정형 데이터 세트에 대한 중앙 메타데이터 저장소 역할을 합니다. 통합 거버넌스 및 데이터 검색을 제공하므로 사용자는 다양한 스키마 및 스토리지 위치에서 데이터 세트를 검색하고 관리할 수 있습니다.
카탈로그
AI 데이터 플랫폼 워크벤치의 카탈로그는 스키마, 테이블, 볼륨 및 모델의 논리적 그룹화로, 데이터 세트를 체계적으로 구성할 수 있는 방법을 제공합니다. 사용자는 여러 프로젝트 또는 팀에 대해 여러 카탈로그를 생성하여 효과적인 데이터 세분화를 보장할 수 있습니다.
스키마
스키마는 카탈로그 내의 구조를 정의하며 공통 네임스페이스 아래에 테이블과 뷰를 구성합니다. 스키마는 다양한 애플리케이션 및 분석 워크로드를 위한 데이터를 논리적으로 구조화하는 데 도움이 됩니다.
테이블
AI 데이터 플랫폼 워크벤치의 테이블은 질의 및 처리가 가능한 구조화된 데이터 세트를 나타냅니다. 테이블은 델타 균일(Delta Uniform)을 포함한 다양한 저장 형식을 지원하여 여러 query 엔진과의 호환성을 보장합니다.
보기
뷰는 기본 테이블에 저장된 데이터의 질의 가능한 표현을 제공하는 AI 데이터 플랫폼 워크벤치의 가상 테이블입니다. 뷰를 사용하면 데이터 중복 없이도 변환된 데이터 집합에 대한 액세스를 간소화할 수 있습니다.
볼륨
볼륨은 원시, 처리 및 선별된 데이터를 지속하기 위한 관리 공간을 제공하는 AI 데이터 플랫폼 워크벤치의 스토리지 추상화입니다. 효율적인 데이터 액세스 및 오브젝트 스토리지와의 통합을 지원합니다.
자동 채우기
자동 채우기 기능은 OCI 오브젝트 스토리지에 있는 새 데이터 집합을 자동으로 감지하고 등록하여 메타데이터 관리를 간소화합니다. 이를 통해 데이터 카탈로그를 최신 상태로 유지하는 데 드는 수동 작업이 줄어듭니다.
RBAC(역할 기반 액세스 제어)
AI Data Platform은 RBAC를 구현하여 다양한 리소스 전반에 걸쳐 세분화된 액세스 제어를 적용합니다. 사용자는 안전한 협업을 위해 작업영역, 카탈로그 및 데이터세트에 대한 역할 및 권한을 정의할 수 있습니다.
감사 로그
Oracle AI Data Platform Workbench의 감사 로그는 사용자 활동의 세부 레코드를 캡처합니다. 이러한 로그는 사용을 모니터링하고, 규정 준수를 보장하며, 무단 액세스 또는 구성 변경과 같은 문제를 조사하는 데 도움이 됩니다.
3부 네임스페이스
AI Data Platform Workbench는 데이터 세트 액세스를 위한 3부 네임스페이스(Catalog.Schema.Table)를 채택하여 플랫폼 전반에서 데이터를 구조화되고 일관된 방식으로 참조할 수 있도록 합니다. 이 표준화는 상호 운용성과 액세스 용이성을 향상시킵니다.