当您创建数据集时,Oracle Analytics 将执行列级分析以生成一组语义建议,供您修复或扩充数据。当您创建工作簿时,您还可以通过从数据面板添加知识库扩充来将其包含在可视化中。
这些建议基于系统在分析步骤中自动检测到的特定语义类型。例如,对于基于本地主题区域的数据集,使用简单的“前 N 个”示例进行分析。
有多种类别的语义类型,例如,由城市名称标识的地理位置、可识别模式(信用卡、电子邮件地址和社会安全号中的模式)、日期和重复模式。您还可以创建自己的定制语义类型。
用于修复、改进或扩充数据集的建议由数据类型确定。
语义类型建议示例:
根据在数据中找到的模式识别语义类型。
为以下语义类型提供了建议:
语义类型的识别由随服务提供的加载引用知识确定。
为以下语义类型提供了基于引用的建议:
建议的扩充基于语义类型。
扩充是基于地理位置层次结构确定的:
分析进程使用特定阈值来做出有关特定语义类型的决策。
通常来说,列中 85% 的数据值必须满足单个语义类型的标准,系统才能做出分类决定。如果某个列 70% 的数据为名字而 30% 的数据为“其他”,则该列不满足阈值要求,因而不会提出建议。