使用统计分析,您可以在工作簿中突出显示聚类或非正常值,添加预测,并显示趋势线和参照线。
要向工作簿添加统计分析(例如预测、非正常值和趋势线),您可以在数据面板的“分析”窗格上使用现成的分析,如果要对配置进行更多控制,可以在表达式构建器中使用函数。
使用 Oracle Analytics,您可以从数据面板的“分析”窗格添加各种统计分析,这些统计分析已完全配置,您不必是统计专家就可以获得结果。
.png 的说明
如果需要对统计设置进行更多控制,或者要在其他可视化中使用分析,请考虑添加计算并使用表达式构建器定义等效函数。(从“数据”窗格中,依次单击添加 (+) 和创建计算以显示表达式构建器。)例如,可以使用 FORECAST() 函数。
.png 的说明
请参见创建计算的数据元素。
还可以通过右键单击可视化并选择添加统计信息来访问统计分析选项。
.png 的说明
可以向可视化添加以下统计分析,以更深入地了解数据。
.png 的说明
预测
预测函数使用线性回归,根据现有值沿线性趋势预测未来值。
您可以根据现有时间序列数据设置未来要预测值的多个时段。请参见向可视化添加预测。
Oracle 支持以下预测模型类型:
或者,使用 FORECAST
函数创建定制计算,以对设置进行更多控制,或在其他可视化中使用预测。请参见分析函数。
聚类
聚类函数对一组对象进行分组,使同一组中的对象相互之间比与其他组中的对象之间显示出更多的一致性和接近性。例如,您可以在散点图中使用颜色来显示不同组的聚类。请参见在可视化中创建聚类或非正常值。
或者,使用 CLUSTER
函数创建定制计算,以对设置进行更多控制,或在其他可视化中使用聚类。请参见分析函数。
非正常值
非正常值函数显示距离单个值的平均期望最远的数据记录。例如,与其他观察值偏差最大的极值属于此类别。非正常值可以表示度量的可变性、实验误差或新颖性。如果您将非正常值添加到已包含聚类的图表中,则非正常值将被描绘为不同的形状。
非正常值可以使用 K-平均值聚类或分层聚类。请参见在可视化中创建聚类或非正常值。
或者,使用 OUTLIER
函数创建定制计算,以对设置进行更多控制,或在其他可视化中使用非正常值。请参见分析函数。
参照线
参照线函数定义图表中对应于 X 轴或 Y 轴值的水平线或垂直线。请参见向可视化添加参照线。
趋势线
趋势线函数表示所讨论度量的一般过程。趋势线是连接图上多个点的直线。趋势线可帮助您分析可视化中一组值集的特定方向。请参见向可视化添加统计分析。
或者,使用 TRENDLINE
函数创建定制计算,以对设置进行更多控制,或在其他可视化中使用趋势线。请参见分析函数。
可以向工作簿添加基于自回归综合移动平均线 (Auto-Regressive Integrated Moving Average, ARIMA)、季节性 ARIMA 或指数三次平滑 (Exponential Triple Smoothing, ETS) 的预测。例如,您可能想要根据以前夏季的数据预测夏季温度。
使用参照线,您可以在可视化中标识平均值、中间值、百分比段及类似信息。
您可以使用度量、属性、日期和派生日期列来创建参照线和参照条带。
派生日期是具有不同粒度级别(例如年、季度、月和日)的列。Oracle Analytics 会自动为数据集中的任何“日期”、“时间”或“时间戳”列生成派生日期列。
如果您想要使用参数值在可视化上放置参照线或参照条带,可以将参数绑定到可视化中的参照线值或参照条带范围。请参见将参数绑定到参照线或参照条带。
当您在语法面板的“属性”窗格上的“分析”窗格中配置参照线时,可以进行一些设置,例如,选择类型选项显示参照线或参照条带,使用函数选项将默认参照线更改为“平均值”、“百分比段”、“前 N 个”,或者针对日期和日期顺序列使用叠置顺序 (Z Order) 选项将参照线放在可视化前面或后面。如果选择非日期属性列(例如 "City"),可以选择要在其上显示参照线的值(例如 "Chicago")。