資料庫分析功能

資料庫分析功能可讓您執行進階分析與資料探勘分析,例如偵測異常值、將資料分群、進行資料抽樣及相關性分析。連線到 Oracle Database 或 Oracle Autonomous Data Warehouse 即可使用分析功能。

教學課程圖示 LiveLabs Sprint

若要在資料流程編輯器中顯示資料庫分析步驟,您必須連線至 Oracle Database 或 Oracle Autonomous Data Warehouse。

功能類型 描述

動態異常值偵測

不需有預先定義的模型即可偵測輸入資料中的異常值。例如,您可能想要標示出不尋常的財務交易。

在大型資料集部署此功能時,請設定分割資料欄以讓效能最佳化。

動態分群法

不需有預先定義的模型即可將輸入資料分群。例如,您可能會基於行銷目的而想要特徵化或探索客戶群。

在大型資料集部署此功能時,請設定分割資料欄以讓效能最佳化。

常見項目集

透過識別經常一起出現的項目集來尋找資料中的關係。此資料探勘技巧也稱為關聯規則學習、相關性分析,或在零售業中稱為購物籃分析。如果您使用常見項目集作為購物籃分析工具,您可能會發現購買洗髮精的客戶也購買潤髮乳。

此作業相當耗費資源,且其效能取決於數個因素,例如輸入資料集量、異動 ID 的基數,以及項目值資料欄的基數。為了避免可能造成資料庫效能降低,請嘗試使用較高的最低支援百分比值 (預設值為 0.25),然後再逐步降低以在輸出中容納更多項目集。

抽樣資料

選取從表格隨機抽樣的資料百分比。您只要指定想要抽樣的資料百分比即可。例如,您可能想要隨機抽樣 10% 的資料。

文字單詞化

將文字資料分解成相異的單字,並計算每個單字的出現次數。當您執行資料流程時,Oracle Analytics 會在資料庫中建立名為 DR$IndexName$I 的表格,當中包含單詞文字及單詞計數相關詳細資訊。請使用 DR$IndexName$I 表格來建立資料集。

  • 輸出值底下,使用每個欄位旁的建立選項以選取要編製索引的資料欄。

  • 參數底下的文字資料欄,按一下選取資料欄以選取要分解成個別單字的欄位。使用參照資料欄 <編號> 選項,將一或多個資料欄包含在輸出資料集中。

您用於資料流程的資料庫連線需要特殊資料庫權限。請向您的管理員確認:
  • 您的資料庫帳戶已經 grant EXECUTE on CTXSYS.CTX_DDL to schema name
  • 您的 Oracle Analytics 連線所使用的使用者名稱與來源表格所在的綱要相同。這是避免資料流程執行時發生存取權限問題的最佳做法。
  • 您要分析的資料庫表格資料欄沒有現有的 CONTEXT 索引。如果您要分析的資料庫表格上有現有的 CONTEXT 索引,請先移除該索引,再執行文字單詞化資料流程。

時間序列

時間序列是一種資料探勘技巧,可根據目標值的已知歷史記錄預測目標值。時間序列分析的輸入是一連串目標值。它提供每段時間範圍期間的預估目標值,除了歷史資料還可包含最多 30 個期間。

此模型還可計算各種統計資料,以測量與歷史資料的適合度。這些統計資料可透過參數設定,以額外的輸出資料集形式提供。

注意:時間序列演算法僅在 Oracle Database 版本 18c 之後的版本提供。

取消樞紐分析資料

將資料欄中儲存的資料轉為資料列格式。例如,您可能想要將顯示每年收益度量值的多個資料欄轉為包含年維度之多個值資料列的單一收益資料欄。您只要選取要轉換的度量資料欄並指定新資料欄的名稱,便可得到一個包含較少資料欄但較多資料列的新資料集。

注意:若要使用分析功能,請確定管理員已啟用分析功能 (透過主控台、系統設定值、效能和相容性、在資料流程中啟用資料庫分析節點)。