1 Oracle AI 데이터 플랫폼 및 워크벤치 개요
이 장에서는 새 사용자가 Oracle AI Data Platform Workbench를 시작하기 위한 정보와 절차를 제공합니다.
Oracle AI Data Platform Workbench의 용도
Oracle AI Data Platform Workbench는 데이터 및 AI 워크플로를 구축, 통합관리, 운영하기 위한 통합 환경을 제공합니다.
Oracle AI Data Platform Workbench는 다음을 수행해야 하는 기업을 위해 설계되었습니다.
- 데이터 검색 및 거버넌스 간소화: AI Data Platform Workbench는 정형 및 비정형 데이터의 검색 가능성 및 거버넌스를 향상시키는 중앙화된 메타데이터 저장소(마스터 카탈로그)를 제공합니다.
- 안전한 데이터 협업 지원: RBAC 기반 액세스 제어를 통해 AI Data Platform Workbench를 사용하면 다양한 팀이 엄격한 보안 정책을 유지하면서 공유 데이터세트에 대한 작업을 수행할 수 있습니다.
- 데이터 준비 및 처리 가속화: 노트북 및 워크플로 통합관리를 내장하여 사용자가 데이터를 효율적으로 정리, 변환 및 보강할 수 있습니다.
- 고급 분석 및 AI/ML 지원: AI Data Platform Workbench는 Apache Spark와 통합되어 데이터 과학자 및 분석가가 데이터 레이크 내에서 복잡한 계산 및 모델 교육을 직접 실행할 수 있습니다.
- 데이터 소스 전반의 원활한 통합 보장: AI Data Platform Workbench는 Autonomous Database(ADB), Object Storage(OS) 및 타사 데이터 소스의 외부 카탈로그를 지원하므로 사용자는 데이터 중복 없이도 데이터를 쿼리 및 분석할 수 있습니다.
오픈 소스와의 관리 통합
Oracle AI Data Platform Workbench는 오픈 소스 기술을 활용 및 확장하여 강력하면서도 관리되는 경험을 제공합니다.
몇 가지 주요 통합은 다음과 같습니다.
- Apache Spark: AI Data Platform Workbench의 컴퓨트 계층은 Spark를 기반으로 하므로 확장 가능한 분산형 데이터 처리가 가능합니다.
- 델타 레이크 지원: AI Data Platform Workbench는 델타 레이크를 활용하여 데이터 안정성, ACID 트랜잭션, 스키마 발전을 개선합니다.
- Delta Uniform을 통한 Iceberg 및 Hudi 호환성: AI Data Platform Workbench는 Delta Uniform을 통해 Apache Iceberg 및 Apache Hudi에 대한 지원을 확대하여 다양한 저장 형식 간의 상호 운용성을 지원합니다. 이를 통해 사용자는 통합 테이블 형식 전략을 채택하는 동시에 효율적인 쿼리 실행 및 데이터 거버넌스를 유지할 수 있습니다.
- BI 툴을 위한 JDBC 통합: AI Data Platform Workbench는 JDBC 드라이버를 제공하여 OAC(Oracle Analytics Cloud) 및 타사 시각화 플랫폼과 같은 외부 BI 툴과의 원활한 연결을 지원합니다.
Oracle AI Data Platform 사용자를 위한 페르소나
Oracle AI Data Platform은 조직 내 다양한 역할 전반의 다양한 사용자에게 고유한 요구 사항 및 요구 사항을 제공합니다.
다음은 AI 데이터 플랫폼과 상호 작용하는 주요 페르소나에 대한 일반적인 개요입니다.
- 데이터 엔지니어 - 데이터 엔지니어는 대규모 데이터 파이프라인을 사용하여 원시 데이터를 분석에 사용할 수 있는 형식으로 변환합니다. 이들은 데이터 워크플로우를 설계 및 관리하고, 다양한 소스에서 데이터를 수집하고, 데이터 품질을 보장하기 위해 AI 데이터 플랫폼의 강력한 기능을 사용합니다. 이들은 프로세스 자동화, 컴퓨팅 리소스 최적화, 다양한 데이터 시스템 원활한 통합에 중점을 두고 있습니다.
- 데이터 분석가 - 데이터 분석가는 AI 데이터 플랫폼을 사용하여 데이터에서 인사이트를 검색, 분석 및 생성합니다. 대규모 데이터 세트를 쿼리하고 분석하려면 직관적인 인터페이스와 도구가 필요합니다. AI 데이터 플랫폼은 대화형 노트북과 비즈니스 인텔리전스(BI) 도구와의 원활한 통합을 통해 원시 데이터를 의사 결정자를 위한 실행 가능한 통찰력으로 전환할 수 있도록 지원합니다.
- 데이터 과학자 - 데이터 과학자는 머신 러닝 및 고급 분석 작업을 위해 AI 데이터 플랫폼의 확장 가능한 컴퓨트 기능을 활용합니다. 다양한 데이터 세트, 강력한 처리 도구 및 복잡한 모델을 실행할 수 있는 기능이 필요합니다. AI Data Platform의 Spark 기반 노트북, AI/ML 통합 및 오픈 소스 라이브러리 지원을 통해 데이터 과학자는 플랫폼 내에서 모델을 구축, 테스트 및 배포할 수 있습니다.
- 데이터 관리인 - 이러한 사용자는 모든 데이터가 업계 규정 및 조직 정책을 준수하여 처리되도록 보장합니다. 이들은 데이터 프라이버시 유지 관리, 액세스 감사 및 조직 전반의 데이터 사용 모니터링에 중점을 둡니다. AI 데이터 플랫폼은 메타데이터를 관리하고, 역할 기반 액세스 제어(RBAC)를 적용하고, 카탈로그화, 계보 추적 및 보안 정책을 통해 적절한 거버넌스를 보장할 수 있도록 지원합니다.
Oracle AI Data Platform의 일반적인 사용 사례
Oracle AI Data Platform은 산업 및 비즈니스 기능 전반에서 다양한 사용 사례를 제공합니다.
메달리온 건축
- 브론즈, 실버 및 골드 레이어를 사용하여 Medallion Architecture를 구현합니다.
- 효율적인 데이터 저장 및 쿼리 최적화를 위해 Delta Uniform 및 Iceberg를 사용합니다.
- 원활한 분석을 위해 외부 데이터 소스에 대한 제로 복사 액세스를 사용으로 설정합니다.
ETL 및 데이터 엔지니어링
- Spark 기반 워크플로우 및 노트북을 사용하여 원시 데이터를 처리, 변환 및 강화할 수 있습니다.
- 로코드/노코드 워크플로 통합관리를 통해 데이터 파이프라인을 자동화할 수 있습니다.
- 대규모 일괄 처리 및 실시간 데이터 수집을 처리합니다.
머신 러닝, AI 및 데이터 과학
- Spark 기반 노트북을 사용하여 머신 러닝 모델을 교육하고 배포합니다.
- 대규모 기능 엔지니어링 및 데이터 변환을 지원합니다.
- Python 및 PySpark 워크로드를 위한 관리형 실행 환경을 제공합니다.
엔터프라이즈 데이터를 활용하는 AI 에이전트 구축
- 대화형 AI 에이전트를 생성하여 데이터 검색 및 개발을 지원합니다.
엔터프라이즈 데이터 카탈로그 및 거버넌스, 델타 공유
- 정형 및 비정형 데이터를 위한 중앙화된 메타데이터 관리.
- 안전한 데이터 액세스 및 협업을 위한 역할 기반 액세스 제어(RBAC)입니다.
- Autonomous Database(ADB) 및 Object Storage를 포함한 외부 카탈로그와의 통합.
- Oracle AI Data Platform은 델타 공유를 지원하여 조직의 경계를 넘어 안전하고 실시간으로 관리되는 데이터 공유를 지원합니다.
분석, Business Intelligence 및 보고
- Tableau, Power BI와 같은 JDBC를 통해 OCI Oracle Analytics Cloud(OAC) 및 타사 BI 도구를 연결합니다.
멀티 클라우드 및 하이브리드 데이터 통합
- 여러 OCI 서비스에서 통합 질의 실행을 사용으로 설정합니다.
- 하이브리드 분석을 위해 타사 클라우드 스토리지 및 데이터베이스와 통합합니다.
- 여러 환경에서 데이터 주권 및 규제 준수를 유지합니다.