內部來源
Oracle AI Data Platform Workbench 支援使用內建擷取連接器從內部 Oracle 來源擷取。這些連接器可讓使用者使用 Spark 型筆記型電腦無縫擷取資料,並將其整合至工作流程和資料管線中。
攝取連接器會抽象化連線設定的複雜性,為批次提供最佳化的存取模式,並從 Oracle 原生服務進行近乎即時的擷取。
AI Data Platform Workbench 在 Oracle AI Data Platform Workbench 範例 Git 儲存庫中提供範例程式碼範本,以支援在筆記型電腦中使用 Spark 從數個內部來源擷取資料。
表格 14-1 內部來源
| 來源 | 存取類型 | 整合方式 | 描述 | 外部目錄支援 | 可用的範例程式碼 |
|---|---|---|---|---|---|
| Fusion | 僅擷取 | 預先設定的 Spark 樣板 | 透過 BICC 將資料從 Fusion SaaS 應用程式擷取至 AI Data Platform Workbench 表格或磁碟區。 | 編號 | 是 |
| REST 端點 | 唯讀 | 透過 Spark 記事本的 JDBC | 從 API 讀取,以擷取半結構化資料 (例如 JSON)。 | 編號 | 是 |
| MySQL HeatWave | 唯讀 | 透過 Spark 記事本的 JDBC | 使用 JDBC 在 AI Data Platform Workbench 和 MySQL HeatWave 之間移動資料。 | 編號 | 是 |
| Oracle Autonomous AI Lakehouse | 讀取 / 寫入 + 零複製 | JDBC 或外部目錄 | 從 Oracle Autonomous AI Lakehouse 擷取或註冊為外部目錄,以直接查詢資料而不複製。 | 是 | 是 |
| Oracle Autonomous AI Transaction Processing | 讀取 / 寫入 + 零複製 | JDBC 或外部目錄 | 擷取或註冊為外部目錄,以直接查詢資料而不複製。 | 是 | 是 |
| Oracle Database | Read/Write - 讀取/寫入 | JDBC 或外部目錄 | 支援從內部部署或 OCI 資料庫擷取資料。 | 是 | 是 |
| Exadata | Read/Write - 讀取/寫入 | JDBC 或外部目錄 | 存取 Exadata 系統,以使用 JDBC 進行高效能讀取和寫入。 | 編號 | 是 |
表格 14-2 Spark SQL to ,Oracle Autonomous AI Database ,Exadata 資料類型對應
| Spark SQL 類型 | Oracle AI Database 、Oracle Autonomous AI Database 、Exadata 資料類型 |
|---|---|
| 位元組類型 | 數字 (38,10) |
| 簡短類型 | 數字 (38,10) |
| 整數類型 (INT) | 數字 (38,10) |
| 詳細類型 | 數字 (38,10) |
| 浮動類型 | FLOAT(126) |
| 雙倍型態 | 數字 (38,10) |
| 小數類型 (p,s) | 數字 (p,s) |
| 字串類型 | VARCHAR2 (4000 個字元) |
| 二進位類型 | BLOB |
| 布林類型 | VARCHAR2 (4000 個字元) |
| 日期類型 | DATE |
| 時間戳記類型 | TIMESTAMP(6) |
| 陣列類型 | VARCHAR2 (4000 個字元) |
| 對應類型 | 不支援 |
| 結構類型 | VARCHAR2 (4000 個字元) |
| 工作曆間隔型態 | 轉換為字串 /VARCHAR2 時支援 |