データ・セットへの予測モデルの適用

データ・フロー・エディタを使用して、任意のデータ・セットに対する予測モデルをスコアリングできます。予測モデルからは、分析やビジュアライゼーションに使用できる予測値を含む列がのある新しいデータ・セットが出力されます。

  1. 「ホーム」ページで、「作成」をクリックし、「データ・フロー」を選択します。
    「データ・セットの追加」ペインが表示されます。
  2. モデルを適用するデータ・セットを選択します。「追加」をクリックします。
  3. データ・フロー・エディタで、「ステップの追加(+)」をクリックします。
  4. リストの最下部に移動し、「モデルの適用」をクリックします。
  5. 「モデルの選択」ダイアログで、モデルを選択して「OK」をクリックします。
  6. 「出力」セクションに移動し、モデルによって返された列を調べます。データ・セットとともに出力する列を選択し、必要に応じて「列名」フィールドを更新します。
    出力列は、モデル・タイプによって異なります。たとえば、数値の予測の場合、出力列にはPredictedValueおよびPredictedConfidenceが含まれます。クラスタリングの場合、出力列にはclusterIdが含まれます。
  7. 「入力」セクションに移動し、スコアリング・データ・セット内の列とモデル内の列とどのように一致したかを調べます。必要に応じて列照合を調整します。パラメータ・セクションには、モデル・タイプに固有のパラメータが表示されます。たとえば、スコアリング用にクラスタリング・モデルを使用する場合、存在する最大null値は、スコアリング・プロセス用に指定できるパラメータです。このパラメータは、欠落値の補完に使用されます。
  8. データ・フロー・エディタで、「ステップの追加(+)」をクリックし、「データの保存」を選択します。
  9. 「名前」フィールドに名前を入力します。必要に応じて、「処理形式」および「デフォルト集計」フィールドでデータのプリファレンスを設定します。
    データを保存するときに、適用モデルでは、選択したモデルの出力列がデータ・セットに追加されます。
  10. 「保存」をクリックし、名前および説明を指定し、「OK」をクリックしてデータ・フローを保存します。
  11. 「データ・フローの実行」をクリックし、プロジェクト内でビジュアライゼーションに使用できるデータ・セットを作成します。