外部源

Oracle AI Data Platform Workbench 支持使用基于 Spark 的记事本连接器从各种来源摄取数据。这些连接器使用户能够以灵活、代码驱动的方式直接从外部源摄取和处理数据。

AI Data Platform Workbench 在 Oracle AI Data Platform Workbench Samples Git 存储库中提供示例代码模板,支持在记事本中使用 Spark 从多个外部系统摄取数据。这些模板是预构建和可定制的,允许用户快速连接、读取和写入来自各种常用系统的数据。

表 14-3 外部摄取源

访问类型 集成方法 说明 外部目录支持 可用示例代码
MySQL 读/写 JDBC 通过 Spark 记事本 使用 JDBC 连接器在 AI Data Platform Workbench 和 MySQL 数据库之间摄取和导出数据。
PostgreSQL 读/写 JDBC 通过 Spark 记事本 支持通过 JDBC 使用 PostgreSQL 进行双向数据移动。
MS SQL Server 读/写 JDBC 通过 Spark 记事本 使用 Spark 和 JDBC 从 Microsoft SQL Server 连接和传输数据。
Kafka 读取 Spark Notebook 中的 Kafka 消费者 从 Kafka 主题进行流摄取
Hive 读/写 JDBC 通过 Spark 记事本 使用 JDBC 连接器在 AI Data Platform Workbench 和 Hive 数据库之间摄取和导出数据