可使用哪些步驟組織及整合資料?

您可以在資料流程中使用下列步驟來組織、整合及轉換資料。例如,您可以合併資料來源、聚總資料或執行地理空間分析。

步驟可讓您以視覺化的方式轉換資料,完全不需具備編寫程式碼的技能。

您可以使用資料流程編輯器新增步驟至您的資料流程。
以下為 GUID-A3C23A5E-F96B-4EC3-9E7F-5917492D8368-default.png 的說明
.png

新增資料欄

新增自訂資料欄至目標資料集。例如,可以將 UNITS 資料欄中的單位數乘以 RETAIL_PRICE 資料欄中的售價,以計算庫存的價值 (亦即 UNITS * RETAIL_PRICE)。

新增資料

新增資料來源至資料流程。例如,如果您要合併兩個資料集,可將這兩個資料集新增至資料流程中。請參閱資料流程的資料庫支援

聚總

套用聚總函數來建立群組總計。例如 count、sum 或 average。

分析情感

對指定的文字資料欄進行情感偵測。例如,您可以分析客戶意見反應以判斷其為正面還是負面。情感分析是根據正面、中性或負面情緒的單字和片語來評估文字。系統會根據分析結果產生新資料欄,其中的值包含「正面」、「中性」或「負面」。

套用 AI 模型

使用人工智慧模型分析資料。例如,您可以使用 OCI Vision 服務中建立的模型,執行物件偵測、影像分類或文字偵測。 請參閱在 Oracle Analytics 中使用 OCI Vision 模型。您也可以使用 OCI Language 服務中建立的模型執行語言分析,例如情感分析和語言偵測。

套用模型

從 Oracle Machine Learning 或 OCI Data Science 套用機器學習模型來分析資料。例如,您可能建立一個用來預測電子郵件是否為垃圾郵件的分類模型。請參閱在資料集套用預測或註冊的 Oracle 機器學習模型

套用自訂命令檔

使用函數來轉換資料,例如使用 Oracle Cloud Infrastructure (OCI) 定義的函數。例如,您可以使用函數將英文文字轉換成西班牙文或德文。您的 Oracle Analytics 管理員會註冊這些函數以提供給您使用。

AutoML

您可以使用 Oracle Autonomous Data Warehouse 的 AutoML 功能,為您建議與訓練預測模型。AutoML 步驟可分析您的資料、計算要使用的最佳演算法,以及在 Oracle Analytics 中註冊預測模型。分析是在資料庫中運算,而不是在 Oracle Analytics 中進行。當您連線至以 Oracle Autonomous Data Warehouse 為基礎的資料集時,便可在步驟選取器中使用此步驟。

請參閱使用 Oracle Autonomous Data Warehouse 中的 AutoML 訓練預測模型

教學課程圖示 教學課程

儲格

將資料值指定到類別,例如高、低或中。例如,可以將 RISK 的值分類成低、中、高三種儲格。

分支

從資料流程建立多個輸出值。例如,如果您有以國家/地區為基礎的銷售異動資料,您可以將美國的資料儲存在第一個分支,並將加拿大的資料儲存在第二個分支。

建立 Essbase 立方體

從試算表或資料庫建立 Essbase 立方體。

累計值

計算移動聚總或執行聚總之類的累計總計。

資料庫分析

執行進階分析與資料探勘分析。例如,您可以偵測異常值、叢集資料、範例資料和執行相關性分析。當您連線至以 Oracle Database 或 Oracle Autonomous Data Warehouse 為基礎的資料集時,便可在步驟選取器中使用此步驟。分析是在資料庫中運算,而不是在 Oracle Analytics 中進行。請參閱資料庫分析功能

篩選

只選取您感興趣的資料。例如,您可以建立篩選條件,將銷售收益資料限制在 2020 年到 2022 年。

圖表分析

執行地理空間分析,例如計算兩個頂點之間的躍點距離或數目。當您連線至以 Oracle Database 或 Oracle Autonomous Data Warehouse 為基礎的資料集時,便可在步驟選取器中使用此步驟。分析是在資料庫中運算,而不是在 Oracle Analytics 中進行。請參閱圖表分析功能

群組

將非數值資料分類至您定義的群組。例如,您可以將業務別 CommunicationDigital 的訂單置於名為 Technology 的群組,以及將 GamesStream 的訂單置於名為 Entertainment 的群組。

結合

根據一個通用資料欄,使用資料庫結合將多個資料來源中的資料做結合。例如,您可以使用客戶 ID 欄位,將 Orders 資料集與 Customer_orders 資料集結合在一起。

合併

將多個資料欄結合為單一資料欄。例如,您可以將街道地址、街道名稱、州/省以及郵遞區號資料欄合併為一個資料欄。

重新命名資料欄

將資料欄的名稱變得更有意義。例如,您可以將 CELL 變更為 Contact Cell Number。

重新排列資料欄順序

變更輸出資料集中的資料欄順序。例如,您可能希望依照資料欄名稱的字母排序資料欄,或者根據資料類型 (字元、整數等) 排序資料欄。

儲存資料

指定資料流程所產生資料的儲存位置。您可以將資料儲存在 Oracle Analytics 的資料集內或儲存在資料庫中。您也可以指定執行時期參數,或者變更預設的資料集名稱。請參閱資料流程的資料庫支援

選取資料欄

指定資料流程中所要包含或排除的資料欄 (預設為包含所有資料欄)。

分割資料欄

從資料欄內擷取資料。例如,如果資料欄包含 001011Black,您可以將此資料分割成兩個個別的資料欄 001011Black

時間序列預測

根據歷史資料計算預測值。預測會從指定的資料集取得一個時間資料欄和一個目標資料欄,然後針對目標資料欄計算預測值。

訓練 <模型類型>

使用數值預測、多重分類、二元分類及分群法的演算法訓練機器學習模型。請參閱訓練機器學習模型的資料流程步驟

機器學習模型經過訓練之後,請使用套用模型步驟將它套用到您的資料。

轉換資料欄

變更資料的格式、結構或值。例如,您可以將文字轉換為大寫、去除資料前後的空格或計算值增加的百分比。

資料列聯集

合併兩個資料來源的資料列 (在 SQL 術語中稱為 UNION 命令)。您可依順序或名稱比對資料欄。