第 II 部分資料管理

Oracle AI Data Platform Workbench 可讓組織有效管理 OCI Object Storage 和其他外部來源 (例如 Autonomous Database、Kafka 等) 中的所有資料和中繼資料。它提供跨資料資產的集中式描述資料,讓企業能夠為其結構化、半結構化和非結構化資料定義統一的存取控制。

AI Data Platform Workbench 可協助企業以無縫接軌的方式解決資料管理使用案例。各種角色在組織中攜手合作,為企業領導者帶來價值。

  • 資料管理者需要探索資料資產和實體,以瞭解資料位於何處、資料結構化和使用方式,進而有效管理資料 / 描述資料週期。
  • 資料管理員可組織目錄、綱要、表格和磁碟區中的資料,以確保資料的儲存、組織及擷取效率和安全。
  • 資料工程師和分析師需要與其他分析師或企業領導者共用資料,以釋放真正的資料價值

尋找資料

AI Data Platform Workbench 中的所有資料資產均可使用以下方式順暢探索:

  • 主目錄總管
  • 使用筆記本、sql/python 檔案時,工作區中的目錄瀏覽器
  • SQL 文法,例如 SHOW、LIST 和 DESCRIBE
  • API

整理資料

您可以組織目錄、綱要、表格、磁碟區中的資料:

  • 標準目錄:標準目錄是綱要 (資料庫) 的邏輯容器,使用者可以在綱要中建立表格、視觀表和磁碟區。標準目錄管理所有子項物件的描述資料生命週期。
  • 外部目錄:外部目錄是由外部資料來源 (例如 Autonomous Database) 提供支援。如果是外部目錄,則只會從外部來源同步描述資料,使用者可以使用以下 3 個部分的名稱查詢位於外部來源的資料:catalog_name.schema.name.table_name。如果是外部目錄,描述資料週期是由外部來源管理,而「主要目錄」會保留描述資料複本。外部目錄只會從外部來源收集描述資料,不會將資料複製到您的 AI 資料平台。

您可以建立下列項目,選擇讓 AI Data Platform Workbench 管理中繼資料生命週期:

  • 外部表格、定義表格、其綱要及參照 OCI 物件儲存中的位置,或
  • 外部磁碟區是藉由定義參照 OCI 物件儲存中位置的磁碟區,然後進一步將檔案和資料夾儲存在磁碟區中

您也可以建立下列項目,選擇讓 AI Data Platform Workbench 管理資料與中繼資料生命週期:

  • 受管理的表格和 AI 資料平台工作台管理客戶租用戶中的 OCI 物件儲存位置
  • 受管理的磁碟區和 AI 資料平台工作台會管理客戶租用戶中的 OCI 物件儲存位置,讓使用者能夠將檔案和資料夾 (半結構化或非結構化資料) 儲存在磁碟區中

資料分享

在 AI Data Platform Workbench 中共用資料可讓使用者與組織內外的使用者共用資料資產。AI Data Platform Workbench 的資料共用是以開源 Delta Share 協定為基礎,並確保資料以安全方式共用,您可以強制執行可共用及建立收件者的權限。

自動填入

「自動填入」功能可自動偵測並建立所選標準目錄中的資料實體,以簡化描述資料管理。這可藉由指向 OCI Object Storage 中的資料位置,讓使用者建立中繼資料擷取器,自動建立大量表格的程序。