可在数据流中使用以下步骤来组织、集成和转换数据。例如,您可以合并数据源、聚合数据或执行地理空间分析。
通过步骤,无需编码技能即可直观地转换数据。
可使用数据流编辑器向数据流中添加步骤。
.png 的说明
添加列
向目标数据集中添加定制列。例如,可以通过将 UNITS
列中的件数与 RETAIL_PRICE
列中的销售价格相乘(即,UNITS
* RETAIL_PRICE
)来计算库存价值。
添加数据
向数据流添加数据源。例如,如果您要合并两个数据集,可以将这两个数据集都添加到数据流中。请参见数据流的数据库支持。
聚合
可以通过应用聚合函数来创建组总计。例如,count、sum 或 average。
分析情感
检测给定文本列的情感(仅英语)。例如,您可以分析客户反馈以确定它是正面的还是负面的。情感分析在评估文本时基于指明正面、中性或负面情绪的单词和短语。根据分析的结果,新列会包含“正面”、“中性”或“负面”。
应用 AI 模型
使用人工智能模型分析数据。例如,您可以使用在 OCI 视觉服务中创建的模型执行对象检测、图像分类或文本检测。 请参见在 Oracle Analytics 中使用 Oracle Cloud Infrastructure Vision 模型。您还可以使用在 OCI 语言服务中创建的模型执行语言分析(例如情感分析和语言检测)。
应用模型
通过应用来自 Oracle Machine Learning 或 OCI 数据科学的机器学习模型来分析数据。例如,您可能创建了分类模型来预测电子邮件是否为垃圾邮件。请参见向数据集应用预测模型或已注册的 Oracle Machine Learning 模型。
应用定制脚本
使用函数(例如 Oracle Cloud Infrastructure (OCI) 中定义的函数)转换数据。例如,您可以使用函数将英语文本转换为西班牙语或德语。由您的 Oracle Analytics 管理员注册这些函数以使其可供您使用。
AutoML
可使用 Oracle Autonomous Data Warehouse 的 AutoML 功能为您推荐和训练预测模型。在 AutoML 步骤中,将分析数据,计算要使用的最佳算法,并在 Oracle Analytics 中注册预测模型。分析在数据库中而非在 Oracle Analytics 中进行计算。当您连接到基于 Oracle Autonomous Data Warehouse 的数据集时,步骤选择器中将提供此步骤。
收集器
将数据值分配到相应的类别(例如高、低或中)中。例如,您可以按低、中和高将 RISK
的值分类到三个收集器中。
分支
可以从数据流创建多个输出。例如,如果您有基于国家/地区的销售交易数据,则可以将美国的数据保存在第一个分支中,将加拿大的数据保存在第二个分支中。
创建 Essbase 多维数据集
基于电子表格或数据库创建 Essbase 多维数据集。
累计值
计算累计总和,例如移动聚合或运行聚合。
数据库分析
执行高级分析和数据挖掘分析。例如,您可以检测异常、对数据进行聚类、对数据进行采样和执行关联性分析。当您连接到基于 Oracle 数据库或 Oracle Autonomous Data Warehouse 的数据集时,步骤选择器中将提供此步骤。分析在数据库中而非在 Oracle Analytics 中进行计算。请参见数据库分析函数。
筛选器
仅选择您感兴趣的数据。例如,可以创建筛选器来将销售收入数据限制为 2020 年至 2022 年的数据。
图形分析
执行地理空间分析,例如,计算两个顶点之间的距离或跃点数。当您连接到基于 Oracle 数据库或 Oracle Autonomous Data Warehouse 的数据集时,步骤选择器中将提供此步骤。分析在数据库中而非在 Oracle Analytics 中进行计算。请参见图形分析函数。
组
将非数字数据归到您定义的组类别中。例如,您可以将业务部门 Communication
和 Digital
的订单放到名为 Technology
的组中,将业务部门 Games
和 Stream
的订单放到名为 Entertainment
的组中。
联接
使用基于公用列的数据库联接对来自多个数据源的数据进行组合。例如,您可以使用客户 ID 字段将 Orders
数据集联接到 Customer_orders
数据集。
合并
将多个列组合成单个列。例如,您可以将街道地址、街道名称、省/市/自治区和邮政编码列合并为一列。
重命名列
将列的名称更改为更有意义的名称。例如,您可以将 "CELL" 更改为“联系人手机号”。
对列重新排序
更改输出数据集中列的顺序。例如,您可能希望根据列名按字母顺序对列进行排序,或者根据数据类型(字符、整数等)对列排序。
保存数据
指定数据流生成的数据要保存到的位置。可以将数据保存到 Oracle Analytics 中的数据集中,也可以保存到数据库中。还可以指定运行时参数,或更改默认数据集名称。请参见数据流的数据库支持。
选择列
指定要在数据流中包括或排除的数据列(默认设置是包括所有数据列)。
拆分列
从数据列中提取数据。例如,如果列中包含 001011Black
,您可以将该数据拆分为两个单独的列:001011
和 Black
。
时间序列预测
基于历史数据计算预测值。预测功能从给定的数据集提取时间列和目标列,并计算目标列的预测值。
转换列
更改数据的格式、结构或值。例如,可以将文本转换为大写,从数据中截去前导和尾随空格,或者计算值的增加百分比。
联合行
合并两个数据源的行(在 SQL 术语中称为 UNION 命令)。您可以按顺序或名称匹配列。