14 摄取数据

本章介绍了 AI Data Platform Workbenches 如何从不同的内部和外部来源摄取数据。

Oracle AI Data Platform Workbench 支持使用基于 Spark 的记事本从外部和内部来源无缝摄取数据。无论您是从云服务、内部部署数据库还是 Oracle 原生平台提取数据,AI Data Platform Workbench 都能提供灵活的代码驱动式摄取方法,支持大规模的数据工程工作流。

借助 AI Data Platform Workbench 的摄取连接器,您可以:

  • 使用拖放功能生成用于快速连接设置的记事本代码。
  • 从各种系统摄取批量或近乎实时的数据。
  • 利用基于 Spark 和 JDBC 的模式来高效读取、写入和处理数据。
  • 将外部源注册为目录,以便无需重复即可直接查询。

浏览以下部分以了解详细信息:

  • 外部源— 从 MySQL、PostgreSQL、Kafka 等摄取数据。
  • Internal Sources - Connect with Oracle-native systems like Oracle Autonomous AI Lakehouse, Fusion via BICC, and Oracle Database/Oracle AI Database.