3 Oracle AI Data Platform Workbench 的特性
Oracle AI Data Platform Workbench 是一个现代数据平台,旨在大规模简化数据摄取、处理和分析。它提供了计算、存储和编目功能的无缝集成,以实现高效的数据管理。
AI Data Platform Workbench 的主要功能包括:
工作区
AI Data Platform Workbench 中的工作区充当一个隔离环境,用户可以在其中管理和组织数据湖资源,包括工作流、记事本和库。工作区可以按逻辑对资源进行分组,从而实现高效的协作和监管。
计算服务
AI Data Platform Workbench 为执行数据处理和分析工作负载提供可扩展的 CPU 和 GPU 计算资源。用户可以利用基于 Spark 的执行环境进行高性能处理,支持批处理和交互式工作负载。
备注簿
AI Data Platform Workbench 将记事本作为用于编写和执行代码的交互式开发环境。它支持 Python 和 SparkSQL,支持用户在 AI 数据平台中直接转换、分析和可视化数据。
工作流
工作流组件允许用户定义和编排由记事本、Python 任务、if-else 和其他作业任务组成的数据管道。用户可以创建、计划和监视 ETL、数据转换和分析自动化的工作流。
主目录
主目录用作 AI 数据平台工作台内所有结构化和非结构化数据集的中央元数据存储库。它提供统一的治理和数据发现,允许用户跨不同的方案和存储位置搜索和管理数据集。
目录
AI 数据平台工作台中的目录是方案、表、卷和模型的逻辑分组,提供一种结构化方式来组织数据集。用户可以为不同的项目或团队创建多个目录,以确保有效的数据细分。
方案
方案定义目录中的结构,在公用名称空间下组织表和视图。方案有助于在逻辑上构建不同应用程序和分析工作负载的数据。
表
AI 数据平台工作台中的表表示可以查询和处理的结构化数据集。表支持各种存储格式,包括 Delta Uniform,确保与多个查询引擎兼容。
视图
视图是 AI 数据平台工作台中的虚拟表,它提供存储在基础表中的数据的可查询表示形式。通过视图,可以简化对转换后的数据集的访问,而无需复制数据。
卷
卷是 AI 数据平台工作台中的存储抽象,它为保留原始、已处理和已整理的数据提供了托管空间。它支持高效的数据访问以及与对象存储的集成。
自动填充
“自动填充”功能可自动检测和注册位于 OCI Object Storage 中的新数据集,从而简化元数据管理。这减少了保持数据目录最新情况的手动工作。
基于角色的访问控制 (Role-Based Access Control, RBAC)
AI Data Platform 实施 RBAC,对不同资源实施细粒度的访问控制。用户可以为工作区、目录和数据集定义角色和权限,以确保安全协作。
审计日志
Oracle AI Data Platform Workbench 中的审计日志捕获用户活动的详细记录。这些日志有助于监视使用情况,确保合规性,并调查未经授权的访问或配置更改等问题。
三部分名称空间
AI Data Platform Workbench 采用由三部分组成的名称空间 (Catalog.Schema.Table) 来访问数据集,从而以结构化和一致的方式在整个平台中引用数据。这种标准化提高了互操作性和访问便利性。