データ・セットへの予測モデルの適用

データ・フロー・エディタを使用して、任意のデータ・セットに関する予測モデルをスコアリングします。予測モデルから、分析およびビジュアライゼーションに使用できる予測値が格納された列を含む新しいデータ・セットが出力されます。

「ホーム」ページで、「作成」をクリックして「データ・フロー」を選択します。
「データ・セットの追加」ペインが表示されます。
モデルを適用するデータ・セットを選択します。「追加」をクリックします。
データ・フロー・エディタで、「ステップの追加」(+)をクリックします。
リストの最後に移動し、「モデルの適用」をクリックします。
「モデルの選択」ダイアログで、モデルを選択して「OK」をクリックします。
「出力」セクションに移動し、モデルによって返された列を調べます。データ・セットとともに出力する列を選択し、必要に応じて「列名」フィールドを更新します。
出力列はモデル・タイプによって異なります。たとえば、数値予測の場合、出力列にはPredictedValueおよびPredictedConfidenceが含まれます。また、クラスタリングの場合、出力列はclusterIdです。
「入力」セクションに移動し、スコアリング・データ・セットの列がモデルの列にどの程度一致したかを調べます。必要に応じて、列の照合を調整します。「パラメータ」セクションには、モデル・タイプに固有のパラメータが表示されます。たとえば、スコアリングにクラスタリング・モデルを使用する場合、maximum null values present (存在するnull値の最大数)はスコアリング・プロセスに指定できるパラメータです。このパラメータは、欠損値の補完に使用されます。
データ・フロー・エディタで、「ステップの追加」(+)をクリックして「データの保存」選択します。
「名前」フィールドに名前を入力します。必要に応じて、「処理形式」フィールドと「デフォルト集計」フィールドにデータ・プリファレンスを設定します。
データを保存する際、適用モデルにより、選択したモデルの出力列がデータ・セットに追加されます。
「保存」をクリックして名前と説明を入力し、「OK」をクリックしてデータ・フローを保存します。
「データ・フローの実行」をクリックして、プロジェクトでビジュアライゼーションに使用できるデータ・セットを作成します。