データ・フローの作成

データ・フローを作成して、1つ以上のデータ・セットからデータをキュレートします。たとえば、2つのデータ・セットをマージし、データをクレンジングし、新しいデータ・セットに結果を出力して、このデータ・セットを分析に使用できるようにする場合があります。

  1. 「ホーム」または「データ」ページで、「作成」をクリックして「データ・フロー」を選択します。
  2. 「データ・セットの追加」ダイアログで、データ・セットを選択します。
    「ステップの追加」(+)をクリックしてから、「データの追加」をクリックすると、いつでもデータ・ソースを追加できます。
  3. 「データの追加」ペインで、データを構成します。たとえば、次のようなSQL文です。:
    • 選択したデータ・セットを置換します(「データの追加」 -の横にあるデータ・ソース名をクリックします)。
    • 列を含めるか除外します。
    • 列を名前変更します。
    • データ・フローが実行されたとき、データ・ソースの入力を要求します(実行時、データ・セットを選択するためのプロンプト・オプションを使用)。
  4. データ・フローを構築します。
    • 実行する機能ごとに、「ステップの追加」(+)をクリックし、必要なステップ・タイプをクリックして、「ステップ・エディタ」ペインでプロパティを指定します。

      ヒント: 最後のステップにカーソルを合せると、「ステップの追加」(+)オプションが表示されます。列ヘッダーの「オプション」を使用して、フローの編集やステップの追加を行うこともできます。たとえば、列の名前変更、再フォーマット、マージまたは変換を行うことができます。

    • ステップを削除するには、ステップにカーソルをあわせて「X」をクリックするか、ステップを右クリックして「削除」をクリックします。ステップを削除してデータ・フローの一部を無効にした場合は、問題のあるステップの上に赤い「X」アイコンが表示されます。
    • 保存していないデータ・フローの編集を元に戻すかやり直すには、ワークフローのダイアグラム・パネルのツールバーに移動し、「最後の編集を元に戻す」または「最後の編集をやり直し」をクリックします。
    • データ・フローの最後に、「データの保存」ステップを追加して、わかりやすい名前を指定します。
  5. データ・フローを保存します。
    今すぐ「データ・フローの実行」オプションを使用するか、後で「データ」ページの「データ・フロー」パネルを使用して、データ・フローを開始できます。今すぐ実行すると、「データ」ページの「データ・セット」パネルで生成されたデータ・セットにアクセスできます。
  6. データ・フローを実行します。
    • データ・フローを起動するには、「データ・フローの実行」をクリックします。
    • 後でデータ・フローを起動するには、「データ」ページで「データ・フロー」パネルに移動し、データ・フローを右クリックして「実行」をクリックします。
    データ・フローが完了すると、「データ」ページの「データ・セット」パネルに移動して、生成したデータ・セットにアクセスします。