关于数据流

可以使用数据流来组织和集成数据以生成经过整理的数据集,供用户用于可视化。

可使用数据流直观地操纵数据,无需掌握手动编码技能。

例如,使用数据流可以:

  • 创建数据集。
  • 组合来自不同源的数据。
  • 聚合数据。
  • 训练机器学习模型或向数据应用预测机器学习模型。
  • 通过 OCI 视觉服务使用人工智能执行对象检测、图像分类或文本检测。

在数据流编辑器中创建数据流。
数据流编辑器

要构建数据流,请添加步骤。每个步骤都执行特定函数,例如,添加数据、联接表、合并列、转换数据、保存数据。可使用数据流编辑器添加和配置步骤。添加或更改每个步骤时,系统会对其进行验证。当您配置了数据流后,可执行它以生成或更新数据集。

当您添加自己的列或转换数据时,您可以使用各种各样的 SQL 运算符(例如 BETWEEN、LIKE、IN)、条件表达式(例如 CASE)或函数(例如 Avg、Median、Percentile)。

数据流的数据库支持

使用数据流,您可以整理来自数据集、主题区域或数据库连接的数据。

您可以单独执行数据流,也可以按序列执行数据流。您可以在一个数据流中包含多个数据源,并指定其联接方式。

使用添加数据步骤向数据流中添加数据,使用保存数据步骤保存数据流中的输出数据。

可以将数据流中的输出数据保存到数据集或受支持的某种类型的数据库中。如果您将数据保存到数据库,则可以通过使用数据流中的数据覆盖数据源来转换数据源。数据源和数据流表必须位于相同的数据库中并且具有相同的名称。开始之前,创建与其中一个受支持数据库类型的数据库的连接。

注:

您可以从通过数据网关连接的远程数据库添加数据。但是,不能将数据保存回通过数据网关连接的远程数据库。

数据输出

可以将数据流中的输出数据保存为以下数据库类型:
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle 数据库
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

有关数据库版本信息,请参见支持的数据源

数据输入

您可以从大多数数据库类型(Oracle Essbase 和 EPM Cloud 除外)向数据流中输入数据。

使用数据流编辑器

您可以通过在数据流编辑器中构建数据流来准备用于分析的数据。例如,您可以转换列、合并列或将数据分类到收集器中。了解如何使用数据流编辑器快速开始准备数据。

使用数据流编辑器

名称 图标 功能
数据

数据窗格图标

显示数据窗格,在其中可以将数据列拖放到数据流编辑器上。

数据流步骤 数据流步骤窗格图标

显示步骤窗格,在其中可以将步骤拖放到数据流编辑器上。

数据预览

“数据预览”图标

通过单击数据流编辑器右下角的切换数据预览隐藏或显示预览数据列窗格。对数据流进行更改时,此窗格会自动更新。可以单击自动应用来指定是否自动刷新“预览数据”窗格中的步骤更改。

运行数据流 运行数据流 执行(称为“运行”)数据流。
显示可用函数/隐藏函数

显示可用的函数/隐藏函数图标

显示或隐藏表达式选取列表。仅对您可以构建自己的表达式的步骤(例如,“添加列”步骤或“转换列”步骤)显示此图标。

步骤编辑器

步骤编辑器图标

通过单击数据流编辑器右下角的切换步骤编辑器图标隐藏或显示步骤编辑器窗格。

切换自动刷新 对数据流中的数据切换自动刷新 启用此项后,当您在数据流中进行更改时,将立即刷新数据预览。例如,如果您执行一个转换列步骤,将文本从小写更改为大写,则将在数据预览中看到大写文本。如果禁用此项,则仅当单击刷新数据预览时才会刷新数据预览。

(预览)使用增强的数据流设计器

使用最新的数据流设计器,可使用增强功能更轻松地创建数据流。此用户界面提供了新图标,改进了联接和联合创建,并优化了布局以实现无缝导航。

使用增强的数据流设计器

如果您要使用新设计器,请让管理员启用它。

新设计器具有新图标和增强功能。


GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png 的说明如下
.png 的说明

功能 图标 说明
紧凑布局 “紧凑布局”图标 将步骤分组到较小的视图区域以减少滚动。
扩展布局 “扩展布局”图标 左侧对齐输入数据源步骤以提高可读性。
联接或联合未完成

“完成联接或联合”图标

指示未联接或未联合的数据源。将光标悬停在蓝色链接图标上可查看建议的联接目标(虚线),然后再次单击可完成联接或联合(实线)。

缩放增强功能 “缩放”图标 放大和缩小。