当您创建数据集时,Oracle Analytics 将执行列级概要分析以生成一组语义建议,供您修复或扩充数据。当您创建工作簿时,您还可以通过从数据面板添加知识库扩充来将其包含在可视化中。
注:
默认情况下通常启用知识库扩充,但工作簿编辑人员可以对自己拥有或具有编辑权限的数据集启用或禁用知识库扩充。Oracle Analytics 不会自动为从数据流生成的数据集提供扩充建议。在这种情况下,数据集所有者或管理员必须首先为数据集启用知识库扩充选项。请参见为数据集启用知识库扩充。这些建议基于系统在分析步骤中自动检测到的特定语义类型。例如,对于基于本地主题区域的数据集,使用简单的“前 N 个”示例进行分析。
有多种类别的语义类型,例如,由城市名称标识的地理位置、可识别模式(信用卡、电子邮件地址和社会安全号中的模式)、日期和重复模式。您还可以创建自己的定制语义类型。
用于修复、改进或扩充数据集的建议由数据类型确定。
语义类型建议示例:
根据在数据中找到的模式识别语义类型。
为以下语义类型提供了建议:
语义类型的识别由随服务提供的加载引用知识确定。
为以下语义类型提供了基于引用的建议:
建议的扩充基于语义类型。
扩充是基于地理位置层次结构确定的:
概要分析过程使用特定阈值来做出有关特定语义类型的决策。
通常来说,列中 85% 的数据值必须满足单个语义类型的标准,系统才能做出分类决定。如果某个列 70% 的数据为名字而 30% 的数据为“其他”,则该列不满足阈值要求,因而不会提出建议。
利用定制知识库建议来扩充 Oracle Analytics 系统知识库。定制知识库可以让 Oracle Analytics 语义分析器找到更多业务特定的语义类型,并提出更相关、更可控的扩充建议。例如,您可以添加一条定制知识库参考,将处方药分类为“镇痛药”或“阿片类”USP 药物类别。
让您的管理员将定制知识库文件上载到 Oracle Analytics。当您扩充数据集时,Oracle Analytics 会基于此语义数据提供扩充建议。当您创建工作簿时,您还可以通过从数据面板添加知识库扩充来将其包含在可视化中。
创建自己的定制知识库文件
创建语义文件时,请遵循以下准则:
让您的管理员将定制知识库文件上载到 Oracle Analytics。
此示例说明如何将业务时间范围添加到销售数据中,并在原始数据集不包含财政数据时能够按财政年度分析销售。