データ・セットへの予測モデルの適用

データ・フロー・エディタを使用して、任意のデータ・セットに対する予測モデルをスコアリングできます。予測モデルからは、分析やビジュアライゼーションに使用できる予測値を含む列がのある新しいデータ・セットが出力されます。

「ホーム」ページで、「作成」をクリックし、「データ・フロー」を選択します。
「データ・セットの追加」ペインが表示されます。
モデルを適用するデータ・セットを選択します。「追加」をクリックします。
データ・フロー・エディタで、「ステップの追加(+)」をクリックします。
リストの最下部に移動し、「モデルの適用」をクリックします。
「モデルの選択」ダイアログで、モデルを選択して「OK」をクリックします。
「出力」セクションに移動し、モデルによって返された列を調べます。データ・セットとともに出力する列を選択し、必要に応じて「列名」フィールドを更新します。
出力列は、モデル・タイプによって異なります。たとえば、数値の予測の場合、出力列にはPredictedValueおよびPredictedConfidenceが含まれます。クラスタリングの場合、出力列にはclusterIdが含まれます。
「入力」セクションに移動し、スコアリング・データ・セット内の列とモデル内の列とどのように一致したかを調べます。必要に応じて列照合を調整します。パラメータ・セクションには、モデル・タイプに固有のパラメータが表示されます。たとえば、スコアリング用にクラスタリング・モデルを使用する場合、存在する最大null値は、スコアリング・プロセス用に指定できるパラメータです。このパラメータは、欠落値の補完に使用されます。
データ・フロー・エディタで、「ステップの追加(+)」をクリックし、「データの保存」を選択します。
「名前」フィールドに名前を入力します。必要に応じて、「処理形式」および「デフォルト集計」フィールドでデータのプリファレンスを設定します。
データを保存するときに、適用モデルでは、選択したモデルの出力列がデータ・セットに追加されます。
「保存」をクリックし、名前および説明を指定し、「OK」をクリックしてデータ・フローを保存します。
「データ・フローの実行」をクリックし、プロジェクト内でビジュアライゼーションに使用できるデータ・セットを作成します。