任意のデータセットに対して予測モデルをスコアリングする場合や、対応するデータベースのデータセットに対して登録されているOracle機械学習モデルをスコアリングする場合は、データ・フロー・エディタを使用します。
予測モデルをデータに適用すると、機械学習(ML)や人工知能(AI)の専門知識がなくても、MLおよびAIをアプリケーションに組み込むことができます。
モデルを実行すると、分析やビジュアライゼーションに使用できる予測値が列に格納された新規データセットが出力されます。
予測モデルを実行すると、データはOracle Analyticsに移動されて処理されます。登録されているOracle機械学習モデルを実行する場合は、データがデータベースからOracle Analyticsに移動されることはありません。かわりに、モデルは常にデータベースに存在し、処理が行われるのも、出力データセットが格納されるのもデータベースです。
データ・フローで「モデルの適用」ステップを使用する場合:
-
登録されているモデルを表示して、レビューや分析に使用できます。登録されていないモデルは表示されません。
-
使用可能な出力列は、モデル・タイプに固有です。たとえば、数値予測の場合、出力列にはPredictedValueおよびPredictedConfidenceが含まれ、クラスタリングの場合はclusterIdが含まれます。
-
使用可能なパラメータは、モデル・タイプに固有です。たとえば、スコアリングにクラスタリング・モデルを使用する場合、最大null値は、スコアリング・プロセスに指定できるパラメータです。このパラメータは欠落している値の補完で使用されます。
-
Oracle機械学習モデルを使用する場合は、モデルとマップされた入力データ型が一致している必要があります。「登録されているモデルの詳細の表示」を参照してください。
- ホーム・ページで、「作成」をクリックし、「データ・フロー」をクリックします。
- データセットを選択し、「追加」をクリックします。
- データ・フロー・エディタで、「ステップの追加」(+)をクリックします。
- 「データ・フロー・ステップ」ペインで「モデルの適用」をダブルクリックし、使用するモデルを選択します。
- 「モデルの適用」で「入力」セクションに移動し、入力とする列を選択します。
- 「モデルの適用」で「出力」セクションに移動し、データセットを使用して作成する列を選択し、必要に応じて「列名」フィールドを更新します。
- データ・フロー・エディタで、「ステップの追加」(+)をクリックし、「データの保存」を選択します。
- 名前を入力します。「データ保存先」フィールドで、出力データを保存するための場所を指定します。
Oracle機械学習モデルを使用する場合、入力データセットの接続には、データセットの接続情報がデフォルトで設定されます。
- 「処理形式」および「デフォルト集計」フィールドで、必要に応じてデータ・プリファレンスを設定します。
データを保存する際、モデルの適用により、入力データセットに選択したモデルの出力列が追加されます。
- 「保存」をクリックして、データ・フローの名前と説明を入力し、「OK」をクリックしてデータ・フローを保存します。
- 「データ・フローの実行」をクリックして、データセットを作成します。