使用統計分析來增強視覺化資料

統計分析可讓您在工作簿中標示叢集或極端值、新增預測,以及顯示趨勢與參考線。

在開始使用統計分析之前

若要將統計分析新增至您的工作簿,例如預測、極端值和趨勢線,您可以使用「資料面板」的「分析」窗格中現成的分析,或是使用表示是產生器中的函數以進一步控制組態。

Oracle Analytics 可讓您從「資料面板」的「分析」窗格新增一系列的統計分析,這些分析全都已經設定好了,因此您無須成為統計專家也能獲得結果。
以下為 GUID-F6772E69-9E99-49A9-9DFE-0679A982807A-default.png 的說明
.png

您可以在「語法」面板設定這些分析的基本選項。例如,如果您的視覺化是按月分析「不符合政策的費用」,您可以使用期間選項來指定預測的月數 (在此範例中,'3' 會從 12 月的最終資料點預測 1 月、2 月和 3 月共 3 個月)。

如果需要進一步控制統計設定值,或想要在其他視覺化中使用該分析,請考慮新增計算式並使用表示式產生器定義等效函數。(從「資料面板」的「資料」窗格按一下新增 (+),然後按一下建立計算式以顯示表示式產生器。)例如,您可以使用 FORECAST() 函數。
以下為 GUID-9C973284-481F-4C20-A5FE-390B986ABE0A-default.png 的說明
.png

請參閱建立計算的資料元素

您也可以根據「我的計算式」中儲存的叢集或極端值來建立計算式,便能夠在工作簿的其他視覺化中重複使用該計算式。請參閱根據叢集或極端值建立計算式

可以將什麼統計分析新增至視覺化?

將這些統計分析新增至您的視覺化,可提供對您資料更好的洞察分析。
以下為 GUID-F6772E69-9E99-49A9-9DFE-0679A982807A-default.png 的說明
.png

預測

預測函數會使用線性迴歸,根據現有值及線性趨勢來預測未來值。

您可以根據現有的時間序列資料,設定一些要預測值的未來期間。請參閱新增統計分析至視覺化

Oracle 支援這些預測模型類型:

  • 自動迴歸整合式移動平均值 (ARIMA) - 如果您的過去時間序列資料非季節性,但提供足夠的觀測資料 (至少 50 個,但最好是超過 100 個觀測資料) 來說明和預估未來,請使用此類型。
  • 季節性 ARIMA - 如果您的資料會隨著期間定期重複變更,請使用此類型。例如,每月資料的季節性可能是夏季月份出現高值而冬季月份期間出現低值。
  • 指數三次平滑法 (ETS) - 用來分析沒有明確模式的重複時間序列資料。此模型類型會產生一個指數移動平均值,此平均值會將資料隨時間推移自我重複的傾向納入考量。

或者要對設定值有更多控制,或如果您想要在其他視覺化中使用預測,請使用 FORECAST 函數來建立自訂計算式。請參閱時間序列函數

叢集

叢集函數會將一組物件加以分組,使相同群組中的物件彼此間比與其他群組物件相較更為一致且相近。例如,您可以在散布圖中使用色彩來顯示不同群組的叢集。請參閱新增統計分析至視覺化

  • K-Means 分群法 - 用來將 "n" 個觀測資料分割成 "k" 個叢集,每個觀測資料會被歸類至平均值與其最接近的叢集中。
  • 階層式分群法 - 用來建立以凝聚 (由下而上) 或分裂 (由上而下) 方式組建的叢集階層。

或者要對設定值有更多控制,或如果您想要在其他視覺化中使用叢集,請使用 CLUSTER 函數來建立自訂計算式。請參閱分析函數

極端值

極端值函數會顯示與個別值的平均期望值相距最遠的資料記錄。例如,與其他觀測資料偏差最大的極端值即屬於此類別。極端值可表示計量中的變化性、實驗誤差或新奇性。如果您將極端值新增至已有叢集的圖表中,則系統會以不同的形狀描繪極端值。

極端值可以使用 K-Means 分群法或階層式分群法。請參閱新增統計分析至視覺化

或者要對設定值有更多控制,或如果您想要在其他視覺化中使用極端值,請使用 OUTLIER 函數來建立自訂計算式。請參閱分析函數

參考線

參考線函數可定義圖表中與 X 軸或 Y 軸值對應的水平或垂直線。請參閱新增參考線至視覺化

  • - 您可以選擇計算平均值、最小值或最大值之間的線。例如,在航空業,如果是依據時間繪製乘客人數,則參考線可以顯示特定月份的乘客人數是高於還是低於平均值。
  • 參考帶 - 參考帶代表資料點的上下範圍。您可以選擇自訂選項或標準差函數,並在平均值、最大值與最小值之間做選擇。例如,如果您依月份分析銷售額並使用從平均值到最大值的自訂參考帶,則可以識別高於平均值但低於最大值的月份。

趨勢線

趨勢線函數可指出所討論度量的一般過程。趨勢線是一條連接圖表上一些點的直線。趨勢線可協助您分析視覺化中一組值集的特定方向。請參閱新增統計分析至視覺化

  • 線性 - 搭配線性資料使用。如果您資料的資料點樣式類似一條線,該資料即為線性。線性趨勢線會顯示您的度量以穩定的速率增加或減少。
  • 多項式 - 當資料會變動時,請使用此曲線。例如,分析大型資料集的損益時,這會相當有用。
  • 指數 - 當資料值會以越來越高的速率上升或下降時,請使用此曲線。如果您的資料包含零或負數值,則無法建立指數趨勢線。

或者要對設定值有更多控制,或如果您想要在其他視覺化中使用趨勢線,請使用 TRENDLINE 函數來建立自訂計算式。請參閱分析函數

新增統計分析至視覺化

統計分析可讓您在工作簿中標示叢集或極端值、新增預測,以及顯示趨勢與參考線。

  1. 在首頁中,將游標停駐於工作簿上,按一下動作 「動作」圖示,然後選取開啟
  2. 請確定您的視覺化中包含要新增之分析類型所需的資料。
    例如預測,您至少需要一個時間維度和一個計量或度量。
  3. 在「資料面板」或「語法面板」中,按一下分析圖示 使用資料面板或語法面板上的「分析」圖示存取統計分析。

  4. 將所需的分析從分析窗格拖放到視覺化。
  5. 若要設定分析,請使用「語法」面板上的「分析」窗格。
    例如新增「預測」,您可以變更模型類型或預測期間數目。

您也可以在視覺化按一下滑鼠右鍵並選取新增統計資料來存取統計分析選項。

新增參考線至視覺化

參考線可讓您在視覺化中識別平均值、中位數、百分位數以及類似資訊。

如果您想要使用參數值在視覺化上放置參考線或參考帶,可以將參數連結至視覺化的參考線或參考帶的日期值或日期範圍。請參閱將參數連結至參考線或參考帶
當您在「語法」面板的「分析」窗格中設定參考線時,可以選取類型選項以顯示參考線或參考帶,使用函數選項將預設參考線變更為「平均值」、「百分位數」、「前 N 項」,或對日期和日期排序資料欄使用 Z 排序選項,將參考線置於視覺化前方或後方。如果您選取非日期屬性資料欄 (例如,縣/市),則您可以選擇要顯示參考線的 (例如芝加哥)。
  1. 在首頁中,將游標停駐於工作簿上,按一下動作 「動作」圖示,然後選取開啟
  2. 資料面板中,按一下分析圖示 使用「分析」圖示來新增進階分析函數
  3. 按一下新增統計資料 使用新增統計資料圖示新增統計分析。,然後選取參考線
  4. 使用資料欄選取計量、日期或非日期屬性。
  5. 在「分析」窗格中,選取要更新的特性。
  6. 按一下儲存