自分のデータを編成および統合するために使用できるステップ
データ・フローで次のステップを使用して、データを編成、統合および変換できます。 たとえば、データ・ソースのマージ、データの集計、または地理空間分析を実行できます。
ステップを使用すると、コーディング・スキルを必要とせずにデータを視覚的に変換できます。
データ・フロー・エディタを使用して、データ・フローにステップを追加します。
「
図data-flow-steps-oa.pngの説明」
列の追加
カスタム列をターゲット・データセットに追加します。 たとえば、UNITS列の単位数をRETAIL_PRICE列の販売価格で乗算して、在庫の値を計算できます(つまり、UNITS * RETAIL_PRICE)。
データの追加
データ・ソースをデータ・フローに追加します。 たとえば、2つのデータセットをマージしている場合、両方のデータセットをデータ・フローに追加します。 「データ・フローのデータベース・サポート」を参照してください。
集計
グループ合計を作成し、レコードをカウントし、値を連結します。 たとえば、sum、count、listaggなどです。 「集計関数」を参照してください。
センチメントの分析
特定のテキスト列のセンチメントを検出します(英語のみ)。 たとえば、顧客のフィードバックを分析して、それが正か負かを判断できます。 センチメント分析では、ポジティブ、ニュートラル、ネガティブ感情を示す単語や語句に基づいてテキストが評価されます。 分析の結果に基づいて、新しい列には「正」、「中立」または「負」が表示されます。
AIモデルの適用
人工知能モデルを使用してデータを分析します。 たとえば、OCI Visionサービスで作成されたモデルを使用して、オブジェクト検出、イメージ分類またはテキスト検出を実行できます。 「Oracle AnalyticsでのOracle Cloud Infrastructure Visionモデルの使用」を参照してください。 OCI Language Serviceで作成されたモデルを使用して、センチメント分析や言語検出などの言語分析を実行することもできます。
モデルの適用
Oracle Machine LearningまたはOCI Data Scienceから機械学習モデルを適用して、データを分析します。 たとえば、電子メールがスパムであるかどうかを予測するための分類モデルを作成できます。 「データセットへの予測または登録済Oracle Machine Learningモデルの適用」を参照してください。
カスタム・スクリプトの適用
Oracle Cloud Infrastructure (OCI)で定義されている関数などを使用してデータを変換します。 たとえば、関数を使用して、英語のテキストをスペイン語またはドイツ語に変換できます。 OCI関数を使用したデータの変換を参照してください。
AutoML
Oracle Autonomous AI LakehouseのAutoML機能を使用して、予測モデルを推奨およびトレーニングします。 AutoMLステップでは、データを分析し、使用する最適なアルゴリズムを計算し、Oracle Analyticsに予測モデルを登録します。 アナリティクスは、Oracle Analyticsではなく、データベースで計算されます。 このステップは、Oracle Autonomous AI Lakehouseに基づいてデータセットに接続している場合、ステップ・セレクタで使用できます。
Oracle Autonomous AI LakehouseのAutoMLを使用した予測モデルのトレーニングを参照してください。
ビン
データ値を高、中、低などのカテゴリに割り当てます。 たとえば、RISKの値を低、中および高の3つのビンに分類できます。
Branch
データ・フローから複数の出力を作成します。 たとえば、国に基づく売上トランザクション・データがある場合は、1番目のブランチに米国のデータを、2番目のブランチにカナダのデータを保存します。
累積値
移動集計や実行集計などの累積合計を計算します。
データベース・アナリティクス
高度な分析およびデータ・マイニング分析を実行します。 たとえば、異常、クラスタ・データ、サンプル・データを検出し、アフィニティ分析を実行できます。 このステップは、Oracleデータベース/Oracle AI DatabaseまたはOracle Autonomous AI Lakehouseに基づいてデータセットに接続している場合、ステップ・セレクタで使用できます。 アナリティクスは、Oracle Analyticsではなく、データベースで計算されます。 データベース分析関数を参照してください。
フィルタ
関心のあるデータのみを選択します。 たとえば、売上収益データを2025年から2026年まで制限するフィルタを作成できます。
グラフ分析
距離や2つの頂点間のホップ数の計算など、地理空間分析を実行します。 このステップは、ステップ・セレクタで、OracleデータベースOracle AI DatabaseまたはOracle Autonomous AI Lakehouseに基づいてデータセットに接続している場合に使用できます。 アナリティクスは、Oracle Analyticsではなく、データベースで計算されます。 「グラフ・アナリティクス関数」を参照してください。
グループ
定義したグループに数値以外のデータを分類します。 たとえば、CommunicationおよびDigital事業部門の受注に対してTechnologyという作成グループを作成し、GamesおよびStream事業部門の受注に対してEntertainmentというグループを作成できます。
結合
共通の列に基づくデータベース結合を使用して、複数のデータ・ソースからデータを結合します。 たとえば、顧客IDフィールドを使用してOrdersデータセットをCustomer_ordersデータセットに結合できます。
Merge
複数の列を単一の列に結合します。 たとえば、番地、番地名、都道府県および郵便番号の列を1つの列にマージできます。
列の名前変更
列の名前をよりわかりやすいものに変更します。 たとえば、CELLをContact Cell Numberに変更できます。
列の並替え
出力データセットの列の順序を変更します。 たとえば、列名に基づいて列をアルファベット順に並べ替えたり、データ型(文字、整数など)に基づいて列を並べ替えたりできます。
Save Data
データ・フローによって生成されたデータを保存する場所を指定します。 データは、Oracle Analyticsまたはデータベースのデータセットに保存できます。 また、ランタイム・パラメータを指定したり、デフォルトのデータセット名を変更したり、出力列に独自の説明を追加したりできます。 「データ・フローのデータベース・サポート」を参照してください。
列の選択
データ・フローに含める、または除外する列を指定します(デフォルトではすべてのデータ列が含まれます)。
列の分割
列内からデータを抽出します。 たとえば、列に001011Blackが含まれている場合、このデータを001011とBlackという2つの個別の列に分割できます。
時系列予測
履歴データに基づいて予測値を計算します。 予測では、指定されたデータセットから時間列とターゲット列を取得し、ターゲット列の予測値を計算します。
<モデル・タイプ>のトレーニング
数値予測、多項分類、二項分類およびクラスタリングのためのアルゴリズムを使用して、機械学習モデルをトレーニングします。 「トレーニング機械学習モデルのデータ・フロー・ステップ」を参照してください。
機械学習モデルのトレーニングを完了したら、「モデルの適用」ステップを使用して、データに適用します。
列の変換
データの書式、構造または値を変更します。 たとえば、大文字へのテキストの変換、データからの先頭または末尾のスペースの切捨て、値の増加率の計算などを行えます。
行の結合
2つのデータ・ソースの行をマージします(SQLの用語ではUNIONコマンドと呼ばれます)。 列は、順序または名前で一致させることができます。