データ・セットへの予測モデルまたはOracle機械学習モデルの適用

任意のデータ・セットに対して予測モデルをスコアリングする場合や、対応するデータベースのデータ・セットに対してOracle機械学習モデルをスコアリングする場合は、データ・フロー・エディタを使用します。

モデルを実行すると、分析やビジュアライゼーションに使用できる予測値が列に格納された新規データ・セットが出力されます。

予測モデルを実行すると、データはOracle Analyticsに移動して処理されます。Oracle機械学習モデルを実行する場合は、データがデータベースからOracle Analyticsに移動されることはありません。かわりに、モデルは常にデータベースに存在し、処理が行われるのも、出力データが格納されるのもデータベースです。

  1. 「ホーム」ページで、「作成」をクリックして「データ・フロー」を選択します。
    「データ・セットの追加」ペインが表示されます。
  2. モデルを適用するデータ・セットを選択します。Oracle機械学習モデルを適用する場合は、モデルが存在するのと同じOracle DatabaseまたはOracle Autonomous Data Warehouseからデータ・セットを選択する必要があります。「追加」をクリックします。
  3. データ・フロー・エディタで、「ステップの追加」(+)をクリックします。
  4. リストの最後に移動し、「モデルの適用」をクリックします。
  5. 「モデルの選択」ダイアログで、モデルを選択します。Oracle機械学習モデルを適用する場合は、対応するOracle DatabaseまたはOracle Autonomous Data Warehouseのデータ・セットに登録されているモデルのみが表示されます。「OK」をクリックします。
  6. 「出力」セクションに移動し、モデルによって返された列を調べます。データ・セットとともに出力する列を選択し、必要に応じて「列名」フィールドを更新します。
    出力列はモデル・タイプによって異なります。たとえば、数値予測の場合、出力列にはPredictedValueおよびPredictedConfidenceが含まれます。クラスタリングの場合、出力列にはclusterIdが含まれます。
  7. 「入力」セクションに移動し、スコアリング・データ・セット内の列と、モデル内の列がどのようにマップされているかを調べて調整します。「パラメータ」セクションには、モデル・タイプに固有のパラメータが表示されます。たとえば、スコアリングにクラスタリング・モデルを使用する場合、maximum null values present (存在するnull値の最大数)はスコアリング・プロセスに指定できるパラメータです。このパラメータは、欠損値の補完に使用されます。
    Oracle機械学習モデルを使用する場合は、モデルのデータ型とマップされた入力データの型が一致する必要があります。モデルのデータ型を表示するには、次のようにします:
    1. ホーム・ページで、「コンソール」をクリックします。
    2. 「機械学習」をクリックし、「モデル」タブに移動します。
    3. モデルを探して、「アクション・メニュー」をクリックし、「検査」をクリックします。
    4. 「詳細」タブに移動して入力列セクションを展開し、データ型を表示します。
  8. データ・フロー・エディタで、「ステップの追加」(+)をクリックして「データの保存」選択します。
  9. 「名前」フィールドに名前を入力し、「データ保存先」フィールドで、出力データを保存する場所を確認または選択します。Oracle機械学習モデルを使用する場合、入力データ・セットの接続には、データ・セットの接続情報がデフォルトで設定されます。
  10. 必要に応じて、「処理形式」フィールドと「デフォルト集計」フィールドにデータ・プリファレンスを設定します。
    データを保存する際、適用モデルにより、選択したモデルの出力列がデータ・セットに追加されます。
  11. 「保存」をクリックしてデータ・フローの名前と説明を入力し、「OK」をクリックしてデータ・フローを保存します。
  12. 「データ・フローの実行」をクリックして、データ・セットを作成します。