データ・フローを使用したモデルの適用

データ・フローを使用してモデルを適用し(スコアリングとも呼ばれます)、トレーニング済の機械学習モデルに基づいてデータ・セットを生成します。

たとえば、Naive Bayesスクリプトを使用して二項分類モデルをトレーニングしたとします。これで、このモデルをフル・データ・セットに適用する準備ができました。
「ステップ・エディタ」ペインの「モデルの適用」ステップを使用して、機械学習モデルを適用します。
始める前に、別のデータ・フローを作成して、サンプル・データのトレイン・モデルを作成します。データ・フローを使用したトレイン・モデルの作成を参照してください。
  1. 「ホーム」ページで、「作成」をクリックし、「データ・フロー」を選択して「データ・セットの追加」ペインを表示します。
  2. モデルを適用するデータ・セットを選択し、「追加」をクリックします。
    モデルのトレーニングに使用したデータ・セットと同じ表構造を持つデータ・セットを選択します。
  3. データ・フローで、プラス(+)記号をクリックします。
  4. 使用可能なオプションから「モデルの適用」をクリックします。
  5. 「モデルの選択」ダイアログで、以前に作成したモデルを選択し、「OK」をクリックして確認します。
  6. このデータ・フローによって生成された必要な「出力」列を選択し、必要に応じて「列名」フィールドを更新します。

    「モデルの適用」ペインに表示された出力列が、データ・フローの実行時にデータ・セットとして作成されます。この出力列はモデルに関連しています。

  7. データ・フローで、プラス(+)記号をクリックし、「データの保存」を選択して、デフォルトの「名前」をわかりやすい名前に変更します。
    デフォルトの「名前」の値を変更しない場合は、untitledという名前のデータ・セットが生成されます。オプションで、他のデフォルトのデータ・セット構成の値を必要に応じて変更します。
  8. 「保存」をクリックし、名前と説明を入力して「OK」をクリックして、選択されたモデルおよび出力とともにデータ・フローを保存します。
    これで、データ・フローを実行して、予測を生成できるようになりました。データ・フローを実行するには、「データ・フローの実行」をクリックします。後でデータ・フローを実行するには、ホーム・ページから「データ・フロー」タブに移動し、データ・フローを右クリックして「実行」をクリックします。このデータ・フローを実行すると、「データ・セット」ページ(ホーム・ページのナビゲータで「データ」をクリックします)に、予測を含む生成されたデータ・セットが表示されます。

スコアリング・データ・フローを使用して作成したデータ・セットは、他のデータ・セットと同様にビジュアライゼーション内で使用できます。