自分のデータを編成および統合するために使用できるステップ
データ・フローで次のステップを使用して、データを編成、統合および変換できます。たとえば、データ・ソースのマージ、データの集計、または地理空間分析を実行できます。
データ・フロー・エディタを使用して、データ・フローにステップを適用します。
図data-flow-steps-oa.pngの説明
列の追加
カスタム列をターゲット・データセットに追加します。たとえば、UNITS
列の単位数にRETAIL_PRICE
列の販売価格を掛けて(UNITS
* RETAIL_PRICE
)、在庫の価額を計算できます。
データの追加
データ・ソースをデータ・フローに追加します。たとえば、2つのデータセットをマージしている場合、両方のデータセットをデータ・フローに追加します。
集計
集計関数を適用して、グループ合計を作成します。たとえば、count、sumまたはaverageなどです。
センチメントの分析
特定のテキスト列のセンチメントを検出します。たとえば、顧客フィードバックを分析して、プラスかマイナスかを判断できます。センチメント分析では、正、中立または負の感情を示す単語やフレーズに基づいてテキストを評価します。分析の結果に基づいて、新しい列には「正」、「中立」または「負」が表示されます。
モデルの適用
Oracle Machine LearningまたはOCI Data Scienceから機械学習モデルを適用して、データを分析します。たとえば、電子メールがスパムであるかどうかを予測するための分類モデルを作成できます。「予測モデルまたは登録済Oracle Machine Learningモデルのデータセットへの適用」を参照してください。
AutoML
Oracle Autonomous Data WarehouseのAutoML機能を使用すると、予測モデルの推奨とトレーニングが自動的に行われます。AutoMLステップによってデータが分析され、使用する最善のアルゴリズムが計算され、予測モデルがOracle Analyticsに登録されます。分析の計算は、Oracle Analyticsではなくデータベースで行われます。このステップは、Oracle Autonomous Data Warehouseに基づいたデータセットに接続しているときに、ステップ・セレクタで選択できます。
ビン
データ値を高、中、低などのカテゴリに割り当てます。たとえば、RISK
の値を低、中、高の3つのビンに分類できます。
分岐
データ・フローから複数の出力を作成します。たとえば、国に基づく販売トランザクション・データがある場合、第1分岐に米国のデータを、第2分岐にカナダのデータを保存できます。
Essbaseキューブの作成
スプレッドシートまたはデータベースからEssbaseキューブを作成します。
累計値
移動集計や実行集計などの累積合計を計算します。
データベース・アナリティクス
高度な分析およびデータ・マイニング分析を実行します。たとえば、異常、クラスタ・データ、サンプル・データを検出し、アフィニティ分析を実行できます。このステップは、OracleデータベースまたはOracle Autonomous Data Warehouseに基づいたデータセットに接続されているときに、ステップ・セレクタで選択できます。分析の計算は、Oracle Analyticsではなくデータベースで行われます。データベース分析関数を参照してください。
フィルタ
関心のあるデータのみを選択します。たとえば、フィルタを作成すると、売上収益データを2020年から2022年までに制限できます。
グラフ分析
距離や2つの頂点間のホップ数の計算など、地理空間分析を実行します。このステップは、OracleデータベースまたはOracle Autonomous Data Warehouseに基づいたデータセットに接続されているときに、ステップ・セレクタで選択できます。分析の計算は、Oracle Analyticsではなくデータベースで行われます。「グラフ分析関数」を参照してください。
グループ
定義したグループに数値以外のデータを分類します。たとえば、Communication
やDigital
という部門に対するオーダーをTechnology
というグループに配置し、Games
やStream
に対するオーダーをEntertainment
というグループに配置できます。
結合
共通の列に基づくデータベース結合を使用して、複数のデータ・ソースからデータを結合します。たとえば、顧客IDフィールドを使用してOrders
データセットをCustomer_orders
データセットに結合できます。
マージ
複数の列を単一の列に結合します。たとえば、番地、番地名、都道府県および郵便番号の列を1つの列にマージできます。
列の名前変更
列の名前をよりわかりやすいものに変更します。たとえば、CELLをContact Cell Numberに変更できます。
データの保存
データ・フローによって生成されたデータを保存する場所を指定します。Oracle Analyticsまたはデータベースのデータセットにデータを保存できます。ランタイム・パラメータを指定したり、デフォルトのデータセット名を変更したりできます。
列の選択
データ・フローに含める、または除外する列を指定します(デフォルトではすべてのデータ列が含まれます)。
列の分割
列内からデータを抽出します。たとえば、列に001011Black
が含まれる場合、このデータを001011
とBlack
という2つの個別の列に分割できます。
時系列予測
履歴データに基づいて予測値を計算します。予測では、指定されたデータセットから時間列とターゲット列を取得し、ターゲット列の予測値を計算します。
<モデル・タイプ>のトレーニング
数値予測、多項分類、二項分類およびクラスタリングのためのアルゴリズムを使用して、機械学習モデルをトレーニングします。「機械学習モデルのトレーニングのデータ・フロー・ステップ」を参照してください。
機械学習モデルのトレーニングを完了したら、「モデルの適用」ステップを使用して、データに適用します。
列の変換
データの書式、構造または値を変更します。たとえば、大文字へのテキストの変換、データからの先頭または末尾のスペースの切捨て、値の増加率の計算などを行えます。
行の結合
2つのデータ・ソースの行をマージします(SQLの用語ではUNIONコマンドと呼ばれます)。