可以使用哪些步骤来组织和集成数据?

可在数据流中使用以下步骤来组织、集成和转换数据。例如,您可以合并数据源、聚合数据或执行地理空间分析。

通过步骤,无需编码技能即可直观地转换数据。

可使用数据流编辑器向数据流中添加步骤。
GUID-A3C23A5E-F96B-4EC3-9E7F-5917492D8368-default.png 的说明如下
.png 的说明

添加列

向目标数据集中添加定制列。例如,可以通过将 UNITS 列中的件数与 RETAIL_PRICE 列中的销售价格相乘(即,UNITS * RETAIL_PRICE)来计算库存价值。

添加数据

向数据流添加数据源。例如,如果您要合并两个数据集,可以将这两个数据集都添加到数据流中。请参见数据流的数据库支持

聚合

可以通过应用聚合函数来创建组总计。例如,count、sum 或 average。

分析情感

检测给定文本列的情感(仅英语)。例如,您可以分析客户反馈以确定它是正面的还是负面的。情感分析在评估文本时基于指明正面、中性或负面情绪的单词和短语。根据分析的结果,新列会包含“正面”、“中性”或“负面”。

应用 AI 模型

使用人工智能模型分析数据。例如,您可以使用在 OCI 视觉服务中创建的模型执行对象检测、图像分类或文本检测。 请参见在 Oracle Analytics 中使用 Oracle Cloud Infrastructure Vision 模型。您还可以使用在 OCI 语言服务中创建的模型执行语言分析(例如情感分析和语言检测)。

应用模型

通过应用来自 Oracle Machine Learning 或 OCI 数据科学的机器学习模型来分析数据。例如,您可能创建了分类模型来预测电子邮件是否为垃圾邮件。请参见向数据集应用预测模型或已注册的 Oracle Machine Learning 模型

应用定制脚本

使用函数(例如 Oracle Cloud Infrastructure (OCI) 中定义的函数)转换数据。例如,您可以使用函数将英语文本转换为西班牙语或德语。由您的 Oracle Analytics 管理员注册这些函数以使其可供您使用。

AutoML

可使用 Oracle Autonomous Data Warehouse 的 AutoML 功能为您推荐和训练预测模型。在 AutoML 步骤中,将分析数据,计算要使用的最佳算法,并在 Oracle Analytics 中注册预测模型。分析在数据库中而非在 Oracle Analytics 中进行计算。当您连接到基于 Oracle Autonomous Data Warehouse 的数据集时,步骤选择器中将提供此步骤。

请参见使用 Oracle Autonomous Data Warehouse 中的 AutoML 训练预测模型

“教程”图标 教程

收集器

将数据值分配到相应的类别(例如高、低或中)中。例如,您可以按低、中和高将 RISK 的值分类到三个收集器中。

分支

可以从数据流创建多个输出。例如,如果您有基于国家/地区的销售交易数据,则可以将美国的数据保存在第一个分支中,将加拿大的数据保存在第二个分支中。

创建 Essbase 多维数据集

基于电子表格或数据库创建 Essbase 多维数据集。

累计值

计算累计总和,例如移动聚合或运行聚合。

数据库分析

执行高级分析和数据挖掘分析。例如,您可以检测异常、对数据进行聚类、对数据进行采样和执行关联性分析。当您连接到基于 Oracle 数据库或 Oracle Autonomous Data Warehouse 的数据集时,步骤选择器中将提供此步骤。分析在数据库中而非在 Oracle Analytics 中进行计算。请参见数据库分析函数

筛选器

仅选择您感兴趣的数据。例如,可以创建筛选器来将销售收入数据限制为 2020 年至 2022 年的数据。

图形分析

执行地理空间分析,例如,计算两个顶点之间的距离或跃点数。当您连接到基于 Oracle 数据库或 Oracle Autonomous Data Warehouse 的数据集时,步骤选择器中将提供此步骤。分析在数据库中而非在 Oracle Analytics 中进行计算。请参见图形分析函数

将非数字数据归到您定义的组类别中。例如,您可以将业务部门 CommunicationDigital 的订单放到名为 Technology 的组中,将业务部门 GamesStream 的订单放到名为 Entertainment 的组中。

联接

使用基于公用列的数据库联接对来自多个数据源的数据进行组合。例如,您可以使用客户 ID 字段将 Orders 数据集联接到 Customer_orders 数据集。

合并

将多个列组合成单个列。例如,您可以将街道地址、街道名称、省/市/自治区和邮政编码列合并为一列。

重命名列

将列的名称更改为更有意义的名称。例如,您可以将 "CELL" 更改为“联系人手机号”。

对列重新排序

更改输出数据集中列的顺序。例如,您可能希望根据列名按字母顺序对列进行排序,或者根据数据类型(字符、整数等)对列排序。

保存数据

指定数据流生成的数据要保存到的位置。可以将数据保存到 Oracle Analytics 中的数据集中,也可以保存到数据库中。还可以指定运行时参数,或更改默认数据集名称。请参见数据流的数据库支持

选择列

指定要在数据流中包括或排除的数据列(默认设置是包括所有数据列)。

拆分列

从数据列中提取数据。例如,如果列中包含 001011Black,您可以将该数据拆分为两个单独的列:001011Black

时间序列预测

基于历史数据计算预测值。预测功能从给定的数据集提取时间列和目标列,并计算目标列的预测值。

训练 <model type>

使用数字预测、多元分类、二元分类和聚类算法训练机器学习模型。请参见用于训练机器学习模型的数据流步骤

训练机器学习模型后,使用应用模型步骤将该模型应用于数据。

转换列

更改数据的格式、结构或值。例如,可以将文本转换为大写,从数据中截去前导和尾随空格,或者计算值的增加百分比。

联合行

合并两个数据源的行(在 SQL 术语中称为 UNION 命令)。您可以按顺序或名称匹配列。