內部來源

Oracle AI Data Platform Workbench 支援使用內建擷取連接器從內部 Oracle 來源擷取。這些連接器可讓使用者使用 Spark 型筆記型電腦無縫擷取資料，並將其整合至工作流程和資料管線中。

攝取連接器會抽象化連線設定的複雜性，為批次提供最佳化的存取模式，並從 Oracle 原生服務進行近乎即時的擷取。

AI Data Platform Workbench 在 Oracle AI Data Platform Workbench 範例 Git 儲存庫中提供範例程式碼範本，以支援在筆記型電腦中使用 Spark 從數個內部來源擷取資料。

表格 15-1 內部來源

來源	存取類型	整合方式	描述	外部目錄支援	可用的範例程式碼
Fusion	僅擷取	預先設定的 Spark 樣板	透過 BICC 將資料從 Fusion SaaS 應用程式擷取至 AI Data Platform Workbench 表格或磁碟區。	編號	是
Oracle Siebel	唯讀	預先設定的 Spark 樣板	從 Oracle Siebel 資料庫讀取至 AI Data Platform Workbench 表格或磁碟區	編號	是
Oracle PeopleSoft	唯讀	預先設定的 Spark 樣板	從 Oracle PeopleSoft 資料庫讀取至 AI Data Platform Workbench 表格或磁碟區	編號	是
REST 端點	唯讀	透過 Spark 記事本的 JDBC	從 API 讀取，以擷取半結構化資料 (例如 JSON)。	編號	是
MySQL HeatWave	唯讀	透過 Spark 記事本的 JDBC	使用 JDBC 在 AI Data Platform Workbench 和 MySQL HeatWave 之間移動資料。	編號	是
Oracle Autonomous AI Lakehouse	讀取 / 寫入 + 零複製	JDBC 或外部目錄	從 Oracle Autonomous AI Lakehouse 擷取或註冊為外部目錄，以直接查詢資料而不複製。	是	是
Oracle Autonomous AI Transaction Processing	讀取 / 寫入 + 零複製	JDBC 或外部目錄	擷取或註冊為外部目錄，以直接查詢資料而不複製。	是	是
Oracle Database	Read/Write - 讀取/寫入	JDBC 或外部目錄	支援從內部部署或 OCI 資料庫擷取資料。	是	是
Exadata	Read/Write - 讀取/寫入	JDBC 或外部目錄	存取 Exadata 系統，以使用 JDBC 進行高效能讀取和寫入。	是	是
NetSuite	唯讀	透過 Spark 記事本的 JDBC	從 NetSuite 讀取到 AI 資料平台表格或磁碟區	否	是

表格 15-2 Spark SQL to ，Oracle Autonomous AI Database ，Exadata 資料類型對應

Spark SQL 類型	Oracle AI Database 、Oracle Autonomous AI Database 、Exadata 資料類型
位元組類型	數字 (38,10)
簡短類型	數字 (38,10)
整數類型 (INT)	數字 (38,10)
詳細類型	數字 (38,10)
浮動類型	FLOAT(126)
雙倍型態	數字 (38,10)
小數類型 (p，s)	數字 (p，s)
字串類型	VARCHAR2 (4000 個字元)
二進位類型	BLOB
布林類型	VARCHAR2 (4000 個字元)
日期類型	DATE
時間戳記類型	TIMESTAMP(6)
陣列類型	VARCHAR2 (4000 個字元)
對應類型	不支援
結構類型	VARCHAR2 (4000 個字元)
工作曆間隔型態	轉換為字串 /VARCHAR2 時支援