3 Oracle AI Data Platform Workbench 功能
Oracle AI Data Platform Workbench 是專為簡化大規模資料擷取、處理及分析而設計的現代化資料平台。它提供了運算、儲存和編目功能的無縫整合,以實現高效的資料管理。
AI Data Platform Workbench 的主要功能包括:
工作區
AI Data Platform Workbench 中的工作區可作為隔離環境,使用者可以在其中管理及組織其資料湖資源,包括工作流程、記事本及程式庫。工作區透過將資源以邏輯方式分組,實現有效率的協作和治理。
運算
AI Data Platform Workbench 提供可擴展的 CPU 和 GPU 運算資源,以執行資料處理和分析工作負載。使用者可以利用基於 Spark 的執行環境進行高效能處理,並支援批次和互動式工作負載。
筆記本
AI Data Platform Workbench 包含筆記本作為互動式開發環境,可用於撰寫及執行程式碼。它支援 Python 和 SparkSQL,讓使用者能夠直接在 AI 資料平台內轉換、分析及視覺化資料。
Workflow
工作流程元件可讓使用者定義及協調由記事本、Python 作業、if-else 及其他工作作業組成的資料管線。使用者可以建立、排定及監控 ETL、資料轉換及分析自動化的工作流程。
主要型錄
主目錄是 AI Data Platform Workbench 中所有結構化和非結構化資料集的中央中繼資料儲存庫。它提供統一的治理和資料探索,讓使用者能夠跨不同綱要和儲存體位置搜尋和管理資料集。
目錄
AI Data Platform Workbench 中的目錄是綱要、表格、磁碟區和模型的邏輯群組,提供組織資料集的結構化方式。使用者可以為不同的專案或團隊建立多個目錄,以確保有效的資料區隔。
綱要
綱要定義目錄內的結構,在通用命名空間下組織表格和視觀表。綱要可協助以邏輯方式建構不同應用程式和分析工作負載的資料。
表格
AI Data Platform Workbench 中的表格代表可查詢及處理的結構化資料集。表格支援各種儲存格式,包括 Delta Uniform,確保與多個查詢引擎相容。
檢視
視觀表是「AI 資料平台工作台」中的虛擬表格,提供以查詢方式呈現儲存在基礎表格中的資料。檢視可讓您簡化對已轉換資料集的存取,而無須複製資料。
磁碟區
磁碟區是 AI Data Platform Workbench 中的儲存抽象概念,為保存原始、已處理和策劃的資料提供託管空間。它支援有效率的資料存取與物件儲存整合。
自動填入
「自動填入」功能可自動偵測並註冊位於 OCI 物件儲存中的新資料集,以簡化描述資料管理。這樣可以減少手動作業,讓資料目錄保持在最新狀態。
以角色為基礎的存取控制 (RBAC)
AI Data Platform 導入 RBAC,以對不同資源強制執行微點存取控制。使用者可以為工作區、型錄和資料集定義角色和權限,以確保協同合作安全無虞。
稽核日誌
Oracle AI Data Platform Workbench 中的稽核日誌會擷取使用者活動的詳細記錄。這些日誌可協助監控使用狀況、確保符合規範,以及調查問題,例如未經授權的存取或組態變更。
三部份命名空間
AI Data Platform Workbench 採用三個部分命名空間 (Catalog.Schema.Table) 來存取資料集,提供結構化且一致的方式來參照整個平台的資料。此標準化可改善互通性並簡化存取。