第二部分数据管理
借助 Oracle AI Data Platform Workbench,企业可以有效管理 OCI Object Storage 和其他外部来源(例如 Autonomous Database、Kafka 等)的所有数据和元数据。它可以跨数据资产提供集中式元数据,并支持企业为其结构化、半结构化和非结构化数据定义统一的访问控制。
AI Data Platform Workbench 可帮助企业无缝解决数据管理用例。各种角色在组织中协同工作,为企业领导者提供价值。
- 数据管理员需要发现数据资产和实体,以了解数据所在的位置、数据的结构和使用方式,从而有效地管理数据/元数据生命周期。
- 数据管理员在目录、方案、表和卷中组织数据,确保高效、安全地存储、组织和检索数据。
- 数据工程师和分析师需要与其他分析师或业务负责人共享数据,以释放数据的真正价值
搜索数据
AI Data Platform Workbench 中的所有数据资产都可以使用以下工具进行无缝搜索:
- 主目录浏览器
- 工作区中的目录浏览器,同时使用记事本和 sql/python 文件
- SQL 语法,如 SHOW、LIST 和 DESCRIBE
- API
管理数据
可以在目录、方案、表和卷中组织数据:
- 标准目录:标准目录是方案(数据库)的逻辑容器,用户可以在方案中创建表、视图和卷。标准目录管理所有子对象的元数据的生命周期。
- 外部目录:外部目录由 Autonomous Database 等外部数据源提供支持。对于外部目录,仅从外部源同步元数据,用户可以使用 3 部分名称(如 catalog_name.schema.name.table_name)查询驻留在外部源中的数据。如果是外部目录,则元数据生命周期由外部源管理,主目录将保存元数据副本。外部目录仅从外部源获取元数据,数据不会复制到 AI 数据平台。
您可以通过创建以下项来选择让 AI Data Platform Workbench 管理元数据生命周期:
- 外部表,通过定义表、表方案以及引用 OCI Object Storage 中的位置,或
- 外部卷,通过定义引用 OCI Object Storage 中位置的卷,然后进一步将文件和文件夹存储在卷中
您还可以通过创建以下项来选择让 AI Data Platform Workbench 管理数据和元数据生命周期:
- 托管表和 AI 数据平台工作台可管理客户租户中的 OCI 对象存储位置
- 托管卷和 AI 数据平台工作台管理客户租户中的 OCI 对象存储位置,以便用户可以在卷中存储文件和文件夹(半结构化或非结构化数据)
数据分享
利用 AI Data Platform Workbench 中的数据共享功能,用户可以与组织中的用户以及组织外部的用户共享数据资产。AI Data Platform Workbench 中的数据共享是基于开源 Delta 共享协议构建的,为了确保以安全的方式共享数据,您可以对谁可以共享和创建收件人实施权限。
自动填充
“自动填充”功能通过在所选标准目录中自动检测和创建数据实体来简化元数据管理。这样,用户可以通过指向 OCI Object Storage 中的数据位置来创建元数据提取器,从而自动创建大量表。