关于数据流

可以使用数据流来组织和集成数据以生成经过整理的数据集,供用户用于可视化。

可使用数据流直观地操纵数据,无需掌握手动编码技能。

例如,使用数据流可以:

  • 创建数据集。
  • 组合来自不同源的数据。
  • 聚合数据。
  • 训练机器学习模型或向数据应用预测机器学习模型。
  • 通过 OCI 视觉服务使用人工智能执行对象检测、图像分类或文本检测。

在数据流编辑器中创建数据流。
数据流编辑器

要构建数据流,请添加步骤。每个步骤都执行特定函数,例如,添加数据、联接表、合并列、转换数据、保存数据。可使用数据流编辑器添加和配置步骤。添加或更改每个步骤时,系统会对其进行验证。当您配置了数据流后,可执行它以生成或更新数据集。

当您添加自己的列或转换数据时,您可以使用各种各样的 SQL 运算符(例如 BETWEEN、LIKE、IN)、条件表达式(例如 CASE)或函数(例如 Avg、Median、Percentile)。

数据流的数据库支持

使用数据流,您可以整理来自数据集、主题区域或数据库连接的数据。

使用添加数据步骤向数据流中添加数据,使用保存数据步骤保存数据流中的输出数据。

可以将数据流中的输出数据保存到数据集或受支持的某种类型的数据库中。如果您将数据保存到数据库,则可以通过使用数据流中的数据覆盖数据源来转换数据源。数据源和数据流表必须位于相同的数据库中并且具有相同的名称。开始之前,创建与其中一个受支持数据库类型的数据库的连接。

数据输出

可以将数据流中的输出数据保存为以下数据库类型:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle 数据库
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

数据输入

您可以从大多数数据库类型(Oracle Essbase 和 EPM Cloud 除外)向数据流中输入数据。