データ・セットへの予測モデルの適用

データ・フロー・エディタを使用して、任意のデータ・セットに関する予測モデルをスコアリングします。予測モデルから、分析およびビジュアライゼーションに使用できる予測値が格納された列を含む新しいデータ・セットが出力されます。

  1. 「ホーム」ページで、「作成」をクリックして「データ・フロー」を選択します。
    「データ・セットの追加」ペインが表示されます。
  2. モデルを適用するデータ・セットを選択します。「追加」をクリックします。
  3. データ・フロー・エディタで、「ステップの追加」(+)をクリックします。
  4. リストの最後に移動し、「モデルの適用」をクリックします。
  5. 「モデルの選択」ダイアログで、モデルを選択して「OK」をクリックします。
  6. 「出力」セクションに移動し、モデルによって返された列を調べます。データ・セットとともに出力する列を選択し、必要に応じて「列名」フィールドを更新します。
    出力列はモデル・タイプによって異なります。たとえば、数値予測の場合、出力列にはPredictedValueおよびPredictedConfidenceが含まれます。また、クラスタリングの場合、出力列はclusterIdです。
  7. 「入力」セクションに移動し、スコアリング・データ・セットの列がモデルの列にどの程度一致したかを調べます。必要に応じて、列の照合を調整します。「パラメータ」セクションには、モデル・タイプに固有のパラメータが表示されます。たとえば、スコアリングにクラスタリング・モデルを使用する場合、maximum null values present (存在するnull値の最大数)はスコアリング・プロセスに指定できるパラメータです。このパラメータは、欠損値の補完に使用されます。
  8. データ・フロー・エディタで、「ステップの追加」(+)をクリックして「データの保存」選択します。
  9. 「名前」フィールドに名前を入力します。必要に応じて、「処理形式」フィールドと「デフォルト集計」フィールドにデータ・プリファレンスを設定します。
    データを保存する際、適用モデルにより、選択したモデルの出力列がデータ・セットに追加されます。
  10. 「保存」をクリックして名前と説明を入力し、「OK」をクリックしてデータ・フローを保存します。
  11. 「データ・フローの実行」をクリックして、プロジェクトでビジュアライゼーションに使用できるデータ・セットを作成します。