データ・フローで次のステップを使用して、データを編成、統合および変換できます。たとえば、データ・ソースのマージ、データの集計、または地理空間分析を実行できます。
ステップを使用すると、コーディングのスキルがなくても、データを視覚的に変換できます。
データ・フロー・エディタを使用して、データ・フローにステップを追加します。
.pngの説明
列の追加
カスタム列をターゲット・データセットに追加します。たとえば、UNITS
列の単位数にRETAIL_PRICE
列の販売価格を掛けて(つまり、UNITS
* RETAIL_PRICE
)、在庫の価額を計算できます。
データの追加
データ・ソースをデータ・フローに追加します。たとえば、2つのデータセットをマージしている場合、両方のデータセットをデータ・フローに追加します。データ・フローのデータベース・サポートを参照してください。
集計
集計関数を適用して、グループ合計を作成します。たとえば、count、sumまたはaverageなどです。
センチメントの分析
特定のテキスト列のセンチメントを検出します(英語のみ)。たとえば、顧客フィードバックを分析して、それがポジティブなものかネガティブなものかを判断できます。センチメント分析では、正、中立または負の感情を示す単語やフレーズに基づいてテキストを評価します。分析の結果に基づいて、新しい列には「正」、「中立」または「負」が表示されます。
AIモデルの適用
人工知能モデルを使用してデータを分析します。たとえば、OCI Visionサービスで作成されたモデルを使用して、オブジェクト検出、イメージ分類またはテキスト検出を実行できます。「Oracle AnalyticsでのOracle Cloud Infrastructure Visionモデルの使用」を参照してください。OCI Language Serviceで作成されたモデルを使用して、センチメント分析や言語検出などの言語分析を実行することもできます。
モデルの適用
Oracle Machine LearningまたはOCI Data Scienceから機械学習モデルを適用して、データを分析します。たとえば、電子メールがスパムであるかどうかを予測するための分類モデルを作成できます。データセットへの予測モデルまたは登録済Oracle機械学習モデルの適用を参照してください。
カスタム・スクリプトの適用
Oracle Cloud Infrastructure (OCI)で定義されている関数などを使用してデータを変換します。たとえば、関数を使用して、英語のテキストをスペイン語またはドイツ語に変換できます。Oracle Analytics管理者は、これらの関数を登録してユーザーが使用できるようにします。
AutoML
Oracle Autonomous Data WarehouseのAutoML機能を使用すると、予測モデルの推奨とトレーニングが自動的に行われます。AutoMLステップによってデータが分析され、使用する最善のアルゴリズムが計算され、予測モデルがOracle Analyticsに登録されます。分析の計算は、Oracle Analyticsではなくデータベースで行われます。このステップは、Oracle Autonomous Data Warehouseに基づいたデータセットに接続しているときに、ステップ・セレクタで選択できます。
Oracle Autonomous Data WarehouseのAutoMLを使用した予測モデルのトレーニングを参照してください。
ビン
データ値を高、中、低などのカテゴリに割り当てます。たとえば、RISK
の値を低、中、高の3つのビンに分類できます。
分岐
データ・フローから複数の出力を作成します。たとえば、国に基づく販売トランザクション・データがある場合、第1分岐に米国のデータを、第2分岐にカナダのデータを保存できます。
Essbaseキューブの作成
スプレッドシートまたはデータベースからEssbaseキューブを作成します。
累積値
移動集計や実行集計などの累積合計を計算します。
データベース・アナリティクス
高度な分析およびデータ・マイニング分析を実行します。たとえば、異常の検出、データのクラスタ化、データのサンプリング、アフィニティ分析を実行できます。このステップは、OracleデータベースまたはOracle Autonomous Data Warehouseに基づいたデータセットに接続されているときに、ステップ・セレクタで選択できます。分析の計算は、Oracle Analyticsではなくデータベースで行われます。データベース・アナリティクス関数を参照してください。
フィルタ
関心のあるデータのみを選択します。たとえば、フィルタを作成すると、売上収益データを2020年から2022年までに制限できます。
グラフ分析
距離や2つの頂点間のホップ数の計算など、地理空間分析を実行します。このステップは、OracleデータベースまたはOracle Autonomous Data Warehouseに基づいたデータセットに接続されているときに、ステップ・セレクタで選択できます。分析の計算は、Oracle Analyticsではなくデータベースで行われます。グラフ分析関数を参照してください。
グループ
定義したグループに数値以外のデータを分類します。たとえば、Communication
やDigital
という部門に対するオーダーをTechnology
というグループに配置し、Games
やStream
に対するオーダーをEntertainment
というグループに配置できます。
結合
共通の列に基づくデータベース結合を使用して、複数のデータ・ソースからデータを結合します。たとえば、顧客IDフィールドを使用してOrders
データセットをCustomer_orders
データセットに結合できます。
マージ
複数の列を単一の列に結合します。たとえば、番地、番地名、都道府県および郵便番号の列を1つの列にマージできます。
列の名前変更
列の名前をよりわかりやすいものに変更します。たとえば、CELLをContact Cell Numberに変更できます。
列の並替え
出力データセットの列の順序を変更します。たとえば、列名に基づいて列をアルファベット順に並べ替えたり、データ型(文字、整数など)に基づいて列を並べ替えたりできます。
データの保存
データ・フローによって生成されたデータを保存する場所を指定します。Oracle Analyticsまたはデータベースのデータセットにデータを保存できます。ランタイム・パラメータを指定したり、デフォルトのデータセット名を変更したりできます。データ・フローのデータベース・サポートを参照してください。
列の選択
データ・フローに含める、または除外する列を指定します(デフォルトではすべてのデータ列が含まれます)。
列の分割
列内からデータを抽出します。たとえば、列に001011Black
が含まれる場合、このデータを001011
とBlack
という2つの個別の列に分割できます。
時系列予測
履歴データに基づいて予測値を計算します。予測では、指定されたデータセットから時間列とターゲット列を取得し、ターゲット列の予測値を計算します。
<モデル・タイプ>のトレーニング
数値予測、多項分類、二項分類およびクラスタリングのためのアルゴリズムを使用して、機械学習モデルをトレーニングします。機械学習モデルのトレーニングのデータ・フロー・ステップを参照してください。
機械学習モデルのトレーニングを完了したら、「モデルの適用」ステップを使用して、データに適用します。
列の変換
データの書式、構造または値を変更します。たとえば、大文字へのテキストの変換、データからの先頭または末尾のスペースの切捨て、値の増加率の計算などを行えます。
行の結合
2つのデータ・ソースの行をマージします(SQLの用語ではUNIONコマンドと呼ばれます)。列は、順序または名前で一致させることができます。