統計分析可讓您在工作簿中標示叢集或極端值、新增預測,以及顯示趨勢與參考線。
若要新增統計分析至您的工作簿,例如預測、極端值和趨勢線,您可以使用「資料面板」之「分析」窗格中的現成分析,或者使用表示式產生器的函數進一步控制組態。
Oracle Analytics 可讓您從「資料面板」的「分析」窗格新增一系列的統計分析,這些分析全都已經設定好了,因此您無須成為統計專家也能獲得結果。
.png
如果需要進一步控制統計設定值,或想要在其他視覺化中使用該分析,請考慮新增計算式並使用表示式產生器定義等效函數。(從「資料」窗格中,依序按一下新增 (+) 和建立計算式,以顯示表示式產生器。)例如,您可以使用 FORECAST() 函數。
.png
請參閱建立計算的資料元素。
您也可以在視覺化按一下滑鼠右鍵並選取新增統計資料來存取統計分析選項。
.png
您可以將以下的統計分析新增至您的視覺化,以提供對資料更好的洞察分析。
.png
預測
預測函數會使用線性迴歸,根據現有值及線性趨勢來預測未來值。
您可以根據現有的時間序列資料,設定一些要預測值的未來期間。請參閱新增預測至視覺化。
Oracle 支援這些預測模型類型:
或者,要對設定值有更多控制,或如果您想要在其他視覺化中使用預測,請使用 FORECAST
函數來建立自訂計算式。請參閱分析函數。
叢集
叢集函數會將一組物件加以分組,使相同群組中的物件彼此間比與其他群組物件相較更為一致且相近。例如,您可以在散布圖中使用色彩來顯示不同群組的叢集。請參閱在視覺化中建立叢集或極端值。
或者,要對設定值有更多控制,或如果您想要在其他視覺化中使用叢集,請使用 CLUSTER
函數來建立自訂計算式。請參閱分析函數。
極端值
極端值函數會顯示與個別值的平均期望值相距最遠的資料記錄。例如,與其他觀測資料偏差最大的極端值即屬於此類別。極端值可表示計量中的變化性、實驗誤差或新奇性。如果您將極端值新增至已有叢集的圖表中,則系統會以不同的形狀描繪極端值。
極端值可以使用 K-Means 分群法或階層式分群法。請參閱在視覺化中建立叢集或極端值。
或者,要對設定值有更多控制,或如果您想要在其他視覺化中使用極端值,請使用 OUTLIER
函數來建立自訂計算式。請參閱分析函數。
參考線
參考線函數可定義圖表中與 X 軸或 Y 軸值對應的水平或垂直線。請參閱新增參考線至視覺化。
趨勢線
趨勢線函數可指出所討論度量的一般過程。趨勢線是一條連接圖表上一些點的直線。趨勢線可協助您分析視覺化中一組值集的特定方向。請參閱新增統計分析至視覺化。
或者,要對設定值有更多控制,或如果您想要在其他視覺化中使用趨勢線,請使用 TRENDLINE
函數來建立自訂計算式。請參閱分析函數。
參考線可讓您在視覺化中識別平均值、中位數、百分位數以及類似資訊。
您可以使用計量、屬性、日期以及衍生日期資料欄來建立參考線和參考帶。
衍生日期指的是細微度層級不同的資料欄,例如「年」、「季」、「月」和「日」。Oracle Analytics 會針對資料集中的任何日期、時間或時間戳記資料欄自動產生衍生的日期資料欄。
如果您想要使用參數值在視覺化上放置參考線或參考帶,可以將參數連結至視覺化中的參考線值或參考帶範圍。請參閱將參數連結至參考線或參考帶。
當您在「語法」面板之「特性」窗格的「分析」窗格中設定參考線時,可以選取類型選項以顯示參考線或參考帶,使用函數選項將預設參考線變更為「平均值」、「百分位數」、「前 N 項」,或對日期和日期排序資料欄使用 Z 排序選項,將參考線置於視覺化前方或後方。如果您選取非日期屬性資料欄 (例如,縣/市),則您可以選擇要顯示參考線的值 (例如芝加哥)。