自分のデータのキュレートに使用できるステップ

ステップを使用してデータ・フローを作成することでデータをキュレートし、一般的な変換を実行できます。

列の追加

カスタム列をターゲット・データセットに追加します。たとえば、UNITS列の単位数にRETAIL_PRICE列の販売価格を掛けると(UNITS * RETAIL_PRICE)、在庫の価額を計算できます。

データの追加

データ・ソースをデータ・フローに追加します。たとえば、2つのデータセットをマージしている場合、両方のデータセットをデータ・フローに追加します。

集計

集計関数を適用して、グループ合計を作成します。たとえば、count、sumまたはaverageなどです。

センチメントの分析

特定のテキスト列のセンチメントを検出します。たとえば、顧客フィードバックを分析して、プラスかマイナスかを判断できます。センチメント分析では、正、中立または負の感情を示す単語やフレーズに基づいてテキストを評価します。分析の結果に基づいて、新しい列には「正」、「中立」または「負」が表示されます。

ビン

データ値を高、中、低などのカテゴリに割り当てます。たとえば、RISKの値を低、中、高の3つのビンに分類できます。

分岐

データ・フローから複数の出力を作成します。たとえば、国に基づく販売トランザクション・データがある場合、第1分岐に米国のデータを、第2分岐にカナダのデータを保存できます。

Essbaseキューブの作成

スプレッドシートまたはデータベースからEssbaseキューブを作成します。

累計値

移動集計や実行集計などの累積合計を計算します。

データベース・アナリティクス

高度な分析およびデータ・マイニング分析を実行します。たとえば、異常、クラスタ・データ、サンプル・データを検出し、アフィニティ分析を実行できます。このステップ・タイプをデータ・フロー・エディタに表示するには、OracleデータベースまたはOracle Autonomous Data Warehouseに接続する必要があります(分析はOracle Analyticsではなく、データベースで計算されます)。データベース分析関数を参照してください。

フィルタ

関心のあるデータのみを選択します。たとえば、フィルタを作成すると、売上収益データを2020年から2022年までに制限できます。

グラフ分析

距離や2つの頂点間のホップ数の計算など、地理空間分析を実行します。このステップ・タイプをデータ・フロー・エディタに表示するには、OracleデータベースまたはOracle Autonomous Data Warehouseに接続する必要があります(分析はOracle Analyticsではなく、データベースで計算されます)。「グラフ分析関数」を参照してください。

グループ

定義したグループに数値以外のデータを分類します。たとえば、CommunicationDigitalという部門に対するオーダーをTechnologyというグループに配置し、GamesStreamに対するオーダーをEntertainmentというグループに配置できます。

結合

共通の列に基づくデータベース結合を使用して、複数のデータ・ソースからデータを結合します。たとえば、顧客IDフィールドを使用してOrdersデータセットをCustomer_ordersデータセットに結合できます。

マージ

複数の列を単一の列に結合します。たとえば、番地、番地名、都道府県および郵便番号の列を1つの列にマージできます。

列の名前変更

列の名前をよりわかりやすいものに変更します。たとえば、CELLをContact Cell Numberに変更できます。

データの保存

データ・フローによって生成されたデータを保存する場所を指定します。Oracle Analyticsまたはデータベースのデータセットにデータを保存できます。ランタイム・パラメータを指定したり、デフォルトのデータセット名を変更したりできます。

列の選択

データ・フローに含める、または除外する列を指定します(デフォルトではすべてのデータ列が含まれます)。

列の分割

列内からデータを抽出します。たとえば、列に001011Blackが含まれる場合、このデータを001011Blackという2つの個別の列に分割できます。

時系列予測

履歴データに基づいて予測値を計算します。予測では、指定されたデータセットから時間列とターゲット列を取得し、ターゲット列の予測値を計算します。

<モデル・タイプ>のトレーニング

数値予測、多項分類、二項分類およびクラスタリングのためのアルゴリズムを使用して、機械学習モデルをトレーニングします。「機械学習モデルをトレーニングするためのデータ・フロー・ステップ」を参照してください。

機械学習モデルのトレーニングを完了したら、「モデルの適用」ステップを使用して、データに適用します。

列の変換

データの書式、構造または値を変更します。たとえば、大文字へのテキストの変換、データからの先頭または末尾のスペースの切捨て、値の増加率の計算などを行えます。

行の結合

2つのデータ・ソースの行をマージします(SQLの用語ではUNIONコマンドと呼ばれます)。