4 使用主目錄進行管理
主要型錄
「AI 資料平台工作台」中的主目錄是頂層實體,可讓您透過集中檢視來管理資料和中繼資料。
「主要目錄」是標準和外部目錄的容器。您可以在 Oracle Autonomous AI Lakehouse 、 OCI Object Storage 和 Kafka 中建立包含其資料資產的目錄。「主要目錄」可讓您強制實行其子項物件的權限。
標準型錄和外部型錄具有不同的功能和使用案例:
- 標準目錄:標準目錄是綱要 (資料庫) 的邏輯容器,使用者可以在綱要中建立表格、視觀表和磁碟區。標準目錄管理所有子項物件的描述資料生命週期。
- 外部目錄:外部目錄是由外部資料來源 (例如 Oracle Autonomous AI Lakehouse 、Kafka 等) 提供支援。如果是外部目錄,描述資料會從外部來源同步,使用者可以使用 3 個部分名稱 (例如 catalog_name.schema_name.table_name) 來查詢外部來源中的資料。如果是外部目錄,描述資料週期是由外部來源管理,而「主要目錄」會保留描述資料複本。
主要目錄的使用案例
您可以利用主目錄來協助進行資料準備和分析、儲存非結構化資料等。
使用 SQL 語法查詢及分析資料
在標準目錄中建立受管理或外部表格,以使用熟悉的類似 SQL 語法來查詢和分析資料,讓您更輕鬆地探索和瞭解儲存在 AI 資料平台中的資料。
資料準備
利用儲存在受管理 / 外部表格中的結構化資料格式來準備機器學習模型的資料,讓清理、轉換及功能工程師資料變得更容易。這有助於提升功能工程與模型訓練的資料存取與處理效率
時間差旅
開啟的表格格式支援綱要發展。資料的結構可能會隨時間變更,而不會重寫整個資料集。這些表格可編列版本,且使用者可執行時間差查詢,讓您查詢歷史資料版本,以協助追溯分析與資料回復。
ACID 交易支援
開放式表格格式支援完整的建立、讀取、更新和刪除 (CRUD) 作業,確保資料一致性並啟用資料更新。表格可用來儲存和管理交易資料,讓應用程式能夠追蹤資料的變更。
有效率地讀取及寫入資料
您可以分割 AI Data Platform Workbench 中的表格,以有效率地存取和處理資料,尤其是大型資料集。
儲存並處理非結構化資料
建立受管理磁碟區或外部磁碟區以儲存非結構化資料,以便使用 Apache Spark 處理這些資料。