关于 Oracle Analytics 中的数据扩充和转换

使用 Oracle Analytics,您可以轻松扩充和转换数据,然后再将其用于分析。

“教程”图标 教程

注:

默认情况下通常启用知识库扩充,但工作簿编辑人员可以对自己拥有或具有编辑权限的数据集启用或禁用知识库扩充。Oracle Analytics 不会自动为从数据流生成的数据集提供扩充建议。在这种情况下,数据集所有者或管理员必须首先为数据集启用知识库扩充选项。请参见为数据集启用知识库扩充

导航到转换编辑器

在主页上,将光标悬停在您拥有的数据集上,单击操作,然后选择打开。如果数据集包含多个表,您将看到联接图表。在联接图表中,右键单击数据源,然后单击打开以显示转换编辑器。

通过转换编辑器,可以评估数据质量、编辑元数据以及清理和转换数据。


GUID-E3648C3E-8811-435C-AFB1-BC4E0DE889B5-default.png 的说明如下
.png 的说明

要转换数据,请单击选项(数据列右上方的省略号 省略号),然后选择转换选项(例如收集器重命名转换为文本)。


GUID-48DD220C-19D2-4614-9E6B-ABE498632724-default.png 的说明如下
.png 的说明

应用建议的转换

创建工作簿并向其添加数据集后,将对数据进行列级别概要分析,该分析是对代表性数据示例运行的。对数据进行概要分析后,可以实施为数据集中的可识别列提供的转换和扩充建议。单击右侧“建议”面板中的建议以对其进行实施。
GUID-56820585-E7ED-4ECD-86F5-F008A0FE575B-default.png 的说明如下
.png 的说明

您可以通过以下方式增强或转换数据集:

  • 列连接,将两个单独的列组合成单个列。例如,如果数据集包含名字列和姓氏列,可以使用建议创建包含名字和姓氏的单个列。
  • 管理员已添加到 Oracle Analytics 中的定制知识库扩充。例如,您可以将财政日期添加到定制知识库中,以将特定于业务的时间范围集成到数据中,从而使分析更直观、更富有洞察力。
  • 日期部分提取,例如,从使用月、日、年作为其格式的列中提取星期几。
  • 删除包含敏感字段的列。
  • 使用“提取期限”(“年”、“月”或“天”)对日期列进行持续时间扩充。例如,您可以使用生成的数字列将数据分配到收集器中,例如 0-3 个月、3-6 个月、6+ 个月等。
  • 全局定位系统 (Global Positioning System, GPS) 扩充,例如,城市或邮政编码的纬度和经度。
  • 对敏感字段进行混淆或遮蔽(完全和部分)。
  • 部分提取,例如,从地址中的街道名称中提取门牌号码。
  • 语义提取,例如,从识别的语义类型中分离出信息,例如,从电子邮件地址中分离出域。

应用您自己的转换

除了在“列操作面板”中看到的建议转换之外,您还可以用不同的方式创建自己的转换:

  • 使用每列顶部的选项菜单可以应用常见转换,例如“重命名”、“大写”和“截取”。请参见转换数据

  • 单击数据面板中的添加准备步骤可添加基于定制转换的列。您可以使用多种函数来构建列,如运算符、数学、聚合和转换。请参见将列添加到数据集
  • 使用数据面板左下角的元素选项窗格可更改列类型(将处理为选项设置为属性或度量),或更改默认聚合类型。

    提示:有关设置列类型的建议,请在工具栏上单击查看自动生成的处理为建议 “查看自动生成的处理为建议”图标。例如,如果语义分析器最初将具有数字 ID(例如 1078220)的某一列识别为度量,您可以将该列更改为属性。

数据集转换如何影响工作簿和数据流

应用到一个数据集的数据转换和扩充更改将会影响使用同一数据集的所有工作簿和数据流。当您打开共享数据集的工作簿时,会看到一条消息,指明工作簿使用已更新的数据。刷新数据集中的数据时,准备脚本更改会自动应用到刷新的数据。

刷新概要信息结果

如果更新了系统知识库或定制知识库,并且您对数据集具有作者权限,则您可以通过单击工具栏上的刷新概要信息结果 “刷新概要信息结果”图标,对当前打开的数据集重新进行概要分析并刷新其结果。Oracle Analytics 通常会为您管理此刷新,因此,在大多数情况下,您无需使用此选项。如果更新了系统知识库或定制知识库,并且您想在当前打开的数据集中合并更新,则使用刷新概要信息结果来对数据重新进行概要分析。知识库有更新时,刷新概要信息结果图标将显示提醒,其中显示可用的更新数。