內部來源

Oracle AI Data Platform Workbench 支援使用內建擷取連接器從內部 Oracle 來源擷取。這些連接器可讓使用者使用 Spark 型筆記型電腦無縫擷取資料,並將其整合至工作流程和資料管線中。

攝取連接器會抽象化連線設定的複雜性,為批次提供最佳化的存取模式,並從 Oracle 原生服務進行近乎即時的擷取。

AI Data Platform Workbench 在 Oracle AI Data Platform Workbench 範例 Git 儲存庫中提供範例程式碼範本,以支援在筆記型電腦中使用 Spark 從數個內部來源擷取資料。

表格 14-1 內部來源

來源 存取類型 整合方式 描述 外部目錄支援 可用的範例程式碼
Fusion 僅擷取 預先設定的 Spark 樣板 透過 BICC 將資料從 Fusion SaaS 應用程式擷取至 AI Data Platform Workbench 表格或磁碟區。 編號
REST 端點 唯讀 透過 Spark 記事本的 JDBC 從 API 讀取,以擷取半結構化資料 (例如 JSON)。 編號
MySQL HeatWave 唯讀 透過 Spark 記事本的 JDBC 使用 JDBC 在 AI Data Platform Workbench 和 MySQL HeatWave 之間移動資料。 編號
Oracle Autonomous AI Lakehouse 讀取 / 寫入 + 零複製 JDBC 或外部目錄 Oracle Autonomous AI Lakehouse 擷取或註冊為外部目錄,以直接查詢資料而不複製。
Oracle Autonomous AI Transaction Processing 讀取 / 寫入 + 零複製 JDBC 或外部目錄 擷取或註冊為外部目錄,以直接查詢資料而不複製。
Oracle Database Read/Write - 讀取/寫入 JDBC 或外部目錄 支援從內部部署或 OCI 資料庫擷取資料。
Exadata Read/Write - 讀取/寫入 JDBC 或外部目錄 存取 Exadata 系統,以使用 JDBC 進行高效能讀取和寫入。 編號

表格 14-2 Spark SQL to ,Oracle Autonomous AI Database ,Exadata 資料類型對應

Spark SQL 類型 Oracle AI DatabaseOracle Autonomous AI Database 、Exadata 資料類型
位元組類型 數字 (38,10)
簡短類型 數字 (38,10)
整數類型 (INT) 數字 (38,10)
詳細類型 數字 (38,10)
浮動類型 FLOAT(126)
雙倍型態 數字 (38,10)
小數類型 (p,s) 數字 (p,s)
字串類型 VARCHAR2 (4000 個字元)
二進位類型 BLOB
布林類型 VARCHAR2 (4000 個字元)
日期類型 DATE
時間戳記類型 TIMESTAMP(6)
陣列類型 VARCHAR2 (4000 個字元)
對應類型 不支援
結構類型 VARCHAR2 (4000 個字元)
工作曆間隔型態 轉換為字串 /VARCHAR2 時支援