您可以在資料流程中使用下列步驟來組織、整合及轉換資料。例如,您可以合併資料來源、聚總資料或執行地理空間分析。
步驟可讓您以視覺化的方式轉換資料,完全不需具備編寫程式碼的技能。
您可以使用資料流程編輯器新增步驟至您的資料流程。
.png
新增資料欄
新增自訂資料欄至目標資料集。例如,可以將 UNITS
資料欄中的單位數乘以 RETAIL_PRICE
資料欄中的售價,以計算庫存的價值 (亦即 UNITS
* RETAIL_PRICE
)。
新增資料
新增資料來源至資料流程。例如,如果您要合併兩個資料集,可將這兩個資料集新增至資料流程中。請參閱資料流程的資料庫支援。
聚總
套用聚總函數來建立群組總計。例如 count、sum 或 average。
分析情感
對指定的文字資料欄進行情感偵測。例如,您可以分析客戶意見反應以判斷其為正面還是負面。情感分析是根據正面、中性或負面情緒的單字和片語來評估文字。系統會根據分析結果產生新資料欄,其中的值包含「正面」、「中性」或「負面」。
套用 AI 模型
使用人工智慧模型分析資料。例如,您可以使用 OCI Vision 服務中建立的模型,執行物件偵測、影像分類或文字偵測。 請參閱在 Oracle Analytics 中使用 OCI Vision 模型。您也可以使用 OCI Language 服務中建立的模型執行語言分析,例如情感分析和語言偵測。
套用模型
從 Oracle Machine Learning 或 OCI Data Science 套用機器學習模型來分析資料。例如,您可能建立一個用來預測電子郵件是否為垃圾郵件的分類模型。請參閱在資料集套用預測或註冊的 Oracle 機器學習模型。
套用自訂命令檔
使用函數來轉換資料,例如使用 Oracle Cloud Infrastructure (OCI) 定義的函數。例如,您可以使用函數將英文文字轉換成西班牙文或德文。您的 Oracle Analytics 管理員會註冊這些函數以提供給您使用。
AutoML
您可以使用 Oracle Autonomous Data Warehouse 的 AutoML 功能,為您建議與訓練預測模型。AutoML 步驟可分析您的資料、計算要使用的最佳演算法,以及在 Oracle Analytics 中註冊預測模型。分析是在資料庫中運算,而不是在 Oracle Analytics 中進行。當您連線至以 Oracle Autonomous Data Warehouse 為基礎的資料集時,便可在步驟選取器中使用此步驟。
儲格
將資料值指定到類別,例如高、低或中。例如,可以將 RISK
的值分類成低、中、高三種儲格。
分支
從資料流程建立多個輸出值。例如,如果您有以國家/地區為基礎的銷售異動資料,您可以將美國的資料儲存在第一個分支,並將加拿大的資料儲存在第二個分支。
建立 Essbase 立方體
從試算表或資料庫建立 Essbase 立方體。
累計值
計算移動聚總或執行聚總之類的累計總計。
資料庫分析
執行進階分析與資料探勘分析。例如,您可以偵測異常值、叢集資料、範例資料和執行相關性分析。當您連線至以 Oracle Database 或 Oracle Autonomous Data Warehouse 為基礎的資料集時,便可在步驟選取器中使用此步驟。分析是在資料庫中運算,而不是在 Oracle Analytics 中進行。請參閱資料庫分析功能。
篩選
只選取您感興趣的資料。例如,您可以建立篩選條件,將銷售收益資料限制在 2020 年到 2022 年。
圖表分析
執行地理空間分析,例如計算兩個頂點之間的躍點距離或數目。當您連線至以 Oracle Database 或 Oracle Autonomous Data Warehouse 為基礎的資料集時,便可在步驟選取器中使用此步驟。分析是在資料庫中運算,而不是在 Oracle Analytics 中進行。請參閱圖表分析功能。
群組
將非數值資料分類至您定義的群組。例如,您可以將業務別 Communication
和 Digital
的訂單置於名為 Technology
的群組,以及將 Games
和 Stream
的訂單置於名為 Entertainment
的群組。
結合
根據一個通用資料欄,使用資料庫結合將多個資料來源中的資料做結合。例如,您可以使用客戶 ID 欄位,將 Orders
資料集與 Customer_orders
資料集結合在一起。
合併
將多個資料欄結合為單一資料欄。例如,您可以將街道地址、街道名稱、州/省以及郵遞區號資料欄合併為一個資料欄。
重新命名資料欄
將資料欄的名稱變得更有意義。例如,您可以將 CELL 變更為 Contact Cell Number。
重新排列資料欄順序
變更輸出資料集中的資料欄順序。例如,您可能希望依照資料欄名稱的字母排序資料欄,或者根據資料類型 (字元、整數等) 排序資料欄。
儲存資料
指定資料流程所產生資料的儲存位置。您可以將資料儲存在 Oracle Analytics 的資料集內或儲存在資料庫中。您也可以指定執行時期參數,或者變更預設的資料集名稱。請參閱資料流程的資料庫支援。
選取資料欄
指定資料流程中所要包含或排除的資料欄 (預設為包含所有資料欄)。
分割資料欄
從資料欄內擷取資料。例如,如果資料欄包含 001011Black
,您可以將此資料分割成兩個個別的資料欄 001011
和 Black
。
時間序列預測
根據歷史資料計算預測值。預測會從指定的資料集取得一個時間資料欄和一個目標資料欄,然後針對目標資料欄計算預測值。
轉換資料欄
變更資料的格式、結構或值。例如,您可以將文字轉換為大寫、去除資料前後的空格或計算值增加的百分比。
資料列聯集
合併兩個資料來源的資料列 (在 SQL 術語中稱為 UNION 命令)。您可依順序或名稱比對資料欄。