自分のデータのキュレートに使用できるステップ
ステップを使用してデータ・フローを作成することでデータをキュレートし、一般的な変換を実行できます。
列の追加
カスタム列をターゲット・データセットに追加します。たとえば、UNITS
列の単位数にRETAIL_PRICE
列の販売価格を掛けると(UNITS
* RETAIL_PRICE
)、在庫の価額を計算できます。
データの追加
データ・ソースをデータ・フローに追加します。たとえば、2つのデータセットをマージしている場合、両方のデータセットをデータ・フローに追加します。
集計
集計関数を適用して、グループ合計を作成します。たとえば、count、sumまたはaverageなどです。
センチメントの分析
特定のテキスト列のセンチメントを検出します。たとえば、顧客フィードバックを分析して、プラスかマイナスかを判断できます。センチメント分析では、正、中立または負の感情を示す単語やフレーズに基づいてテキストを評価します。分析の結果に基づいて、新しい列には「正」、「中立」または「負」が表示されます。
ビン
データ値を高、中、低などのカテゴリに割り当てます。たとえば、RISK
の値を低、中、高の3つのビンに分類できます。
分岐
データ・フローから複数の出力を作成します。たとえば、国に基づく販売トランザクション・データがある場合、第1分岐に米国のデータを、第2分岐にカナダのデータを保存できます。
Essbaseキューブの作成
スプレッドシートまたはデータベースからEssbaseキューブを作成します。
累計値
移動集計や実行集計などの累積合計を計算します。
データベース・アナリティクス
高度な分析およびデータ・マイニング分析を実行します。たとえば、異常、クラスタ・データ、サンプル・データを検出し、アフィニティ分析を実行できます。このステップ・タイプをデータ・フロー・エディタに表示するには、OracleデータベースまたはOracle Autonomous Data Warehouseに接続する必要があります(分析はOracle Analyticsではなく、データベースで計算されます)。データベース分析関数を参照してください。
フィルタ
関心のあるデータのみを選択します。たとえば、フィルタを作成すると、売上収益データを2020年から2022年までに制限できます。
グラフ分析
距離や2つの頂点間のホップ数の計算など、地理空間分析を実行します。このステップ・タイプをデータ・フロー・エディタに表示するには、OracleデータベースまたはOracle Autonomous Data Warehouseに接続する必要があります(分析はOracle Analyticsではなく、データベースで計算されます)。「グラフ分析関数」を参照してください。
グループ
定義したグループに数値以外のデータを分類します。たとえば、Communication
やDigital
という部門に対するオーダーをTechnology
というグループに配置し、Games
やStream
に対するオーダーをEntertainment
というグループに配置できます。
結合
共通の列に基づくデータベース結合を使用して、複数のデータ・ソースからデータを結合します。たとえば、顧客IDフィールドを使用してOrders
データセットをCustomer_orders
データセットに結合できます。
マージ
複数の列を単一の列に結合します。たとえば、番地、番地名、都道府県および郵便番号の列を1つの列にマージできます。
列の名前変更
列の名前をよりわかりやすいものに変更します。たとえば、CELLをContact Cell Numberに変更できます。
データの保存
データ・フローによって生成されたデータを保存する場所を指定します。Oracle Analyticsまたはデータベースのデータセットにデータを保存できます。ランタイム・パラメータを指定したり、デフォルトのデータセット名を変更したりできます。
列の選択
データ・フローに含める、または除外する列を指定します(デフォルトではすべてのデータ列が含まれます)。
列の分割
列内からデータを抽出します。たとえば、列に001011Black
が含まれる場合、このデータを001011
とBlack
という2つの個別の列に分割できます。
時系列予測
履歴データに基づいて予測値を計算します。予測では、指定されたデータセットから時間列とターゲット列を取得し、ターゲット列の予測値を計算します。
<モデル・タイプ>のトレーニング
数値予測、多項分類、二項分類およびクラスタリングのためのアルゴリズムを使用して、機械学習モデルをトレーニングします。「機械学習モデルをトレーニングするためのデータ・フロー・ステップ」を参照してください。
機械学習モデルのトレーニングを完了したら、「モデルの適用」ステップを使用して、データに適用します。
列の変換
データの書式、構造または値を変更します。たとえば、大文字へのテキストの変換、データからの先頭または末尾のスペースの切捨て、値の増加率の計算などを行えます。
行の結合
2つのデータ・ソースの行をマージします(SQLの用語ではUNIONコマンドと呼ばれます)。