1 Oracle AI Data Platform 與工作台概要
本章提供新使用者開始使用 Oracle AI Data Platform Workbench 的資訊與程序。
Oracle AI Data Platform Workbench 是什麼用途?
Oracle AI Data Platform Workbench 提供了一個整合的環境,用於建立、協調及操作資料和 AI 工作流程。
Oracle AI Data Platform Workbench 是專為需要下列業務的企業所設計:
- 簡化資料探索與治理: AI Data Platform Workbench 提供集中式中繼資料儲存庫 (主目錄),以增強結構化與非結構化資料的可搜尋性與治理。
- 啟用安全資料協同合作:透過以 RBAC 為基礎的存取控制,AI Data Platform Workbench 可讓不同團隊使用共用資料集,同時維持嚴格的安全原則。
- 加速資料準備與處理:透過內建的筆記型電腦和工作流程協調功能,使用者可以有效率地清理、轉換及豐富資料。
- 支援進階分析和 AI/ML: AI Data Platform Workbench 與 Apache Spark 整合,讓資料科學家和分析師能夠直接在資料湖內執行複雜的運算和模型訓練。
- 確保跨資料來源的無縫整合: AI Data Platform Workbench 支援來自 Autonomous Database (ADB)、Object Storage (OS) 及第三方資料來源的外部目錄,可讓使用者在不複製的情況下查詢和分析資料。
與開放原始碼的受管理整合
Oracle AI Data Platform Workbench 運用與擴充開源技術,提供功能強大且受管理的體驗。
部分關鍵整合包括:
- Apache Spark: AI Data Platform Workbench 的運算層由 Spark 提供技術支援,可進行可擴展的分散式資料處理。
- Delta Lake 支援: AI Data Platform Workbench 利用 Delta Lake 來提升資料可靠性、ACID 交易和綱要發展。
- 透過 Delta Uniform 的 Iceberg 和 Hudi 相容性:透過 Delta Uniform,AI Data Platform Workbench 擴充對 Apache Iceberg 和 Apache Hudi 的支援,實現不同儲存格式的互通性。這可確保使用者採用統一的表格格式策略,同時維持有效率的查詢執行和資料治理。
- 適用於 BI 工具的 JDBC 整合: AI Data Platform Workbench 提供 JDBC 驅動程式,可與 Oracle Analytics Cloud (OAC) 和第三方視覺化平台等外部 BI 工具緊密連線。
Oracle AI Data Platform 使用者角色
Oracle AI Data Platform 為組織內不同角色的各種使用者提供服務,每個角色都有獨特的需求和需求。
以下是與 AI 資料平台互動的主要角色概觀:
- 資料工程師 - 資料工程師可與大規模資料管線搭配運作,將原始資料轉換成可用的格式以進行分析。他們仰賴 AI Data Platform 的強大功能來設計及管理資料工作流程、從各種來源擷取資料,以及確保資料品質。他們專注於自動化流程、最佳化運算資源,以及無縫整合不同資料系統。
- 資料分析師 - 資料分析師使用 AI Data Platform 從資料中尋找、分析及產生洞察。他們需要直觀的介面和工具來查詢和分析大型資料集。AI Data Platform 為其提供互動式筆記型電腦,並與商業智慧 (BI) 工具緊密整合,協助他們將原始資料轉換為決策者的可行洞察。
- 資料科學家 - 資料科學家利用 AI Data Platform 的可擴充運算功能進行機器學習和進階分析工作。他們需要存取各種資料集、強大的處理工具,以及執行複雜模型的能力。AI Data Platform 的 Spark 驅動筆記型電腦、AI/ML 整合,以及開源程式庫支援,可讓資料科學家在平台內建置、測試及部署模型。
- 資料管理者 - 這些使用者可確保所有資料均符合產業法規和組織政策。他們專注於維護整個組織的資料隱私權、稽核存取,以及監控資料使用情況。AI Data Platform 透過編目、歷程追蹤和安全政策,協助他們管理中繼資料、強制執行以角色為基礎的存取控制 (RBAC),並確保妥善治理。
Oracle AI Data Platform 的常見使用案例
Oracle AI Data Platform 提供各種產業和業務功能使用案例。
Medallion 架構
- 以青銅、銀和金層導入 Medallion 架構。
- 使用 Delta Uniform 和 Iceberg 來實現高效率的資料儲存和查詢最佳化。
- 啟用對外部資料來源的零複製存取,以進行無縫分析。
ETL 與資料工程
- 使用以 Spark 為基礎的工作流程和記事本來處理、轉換及強化原始資料。
- 使用低程式碼 / 無程式碼工作流程協調功能,將資料管線自動化。
- 處理大規模批次處理和即時資料擷取。
機器學習、AI 及資料科學
- 使用 Spark 驅動的筆記型電腦訓練和部署機器學習模型。
- 啟用大規模功能工程與資料轉換。
- 為 Python 和 PySpark 工作負載提供受管理的執行環境。
運用企業資料建置 AI Agents
- 建立對話式 AI 代理,協助擷取和開發資料。
企業資料目錄與治理,差異共用
- 結構化和非結構化資料的集中式中繼資料管理。
- 以角色為基礎的存取控制 (RBAC),用於安全的資料存取和協作。
- 與外部目錄 (包括 Autonomous Database (ADB) 和物件儲存) 整合。
- Oracle AI Data Platform 支援 Delta Sharing,實現跨組織邊界的安全、即時和受控的資料共用。
分析、商業智慧與報告
- 透過 JDBC (例如 Tableau、Power BI) 連線 OCI Oracle Analytics Cloud (OAC) 和第三方 BI 工具。
多雲端與混合資料整合
- 啟用跨多個 OCI 服務的同盟查詢執行。
- 與第三方雲端儲存和資料庫整合,以進行混合分析。
- 跨多個環境維護資料主權和合規性。