データ・フローを使用したデータセットの作成

データ・フローを使用して、データをキュレートしデータセットを作成します。たとえば、2つのデータセットをマージし、データをクレンジングし、新しいデータセットに結果を出力する場合があります。

  1. ホーム・ページで、「作成」をクリックし、「データ・フロー」を選択します。
  2. 「データの追加」ダイアログで、データセットまたはサブジェクト領域を選択し、「追加」をクリックします。
    「ステップの追加」(+)をクリックしてから、「データの追加」をクリックすると、いつでもデータ・ソースを追加できます。
  3. オプション: 「データの追加」ペインで、列または列の位置を含めたり除外したりします。たとえば、郵便番号を含め、データセットの最初の列として配置できます。
  4. データ・フローを構築します。
    実行する機能ごとに、「データフロー・ステップ」ペインでステップ名をダブルクリックし、「ステップ・エディタ」ペインでプロパティを指定します。

    「データ・プレビュー」ペインの列ヘッダーの「オプション」を使用してステップを編集することもできます。たとえば、列の名前変更、再フォーマット、マージまたは変換を行うことができます。

  5. 「データの保存」ステップをデータ・フローの最後に追加し、必要に応じてデフォルトのデータセット名を変更します。
    出力データセットは、データ・フローと同じカタログの場所に保存されます。
    オプションで、「処理形式」および「デフォルト集計」列の設定を調整し、列の説明を追加できます。
  6. データ・フローを保存します。
    「データ・フローの実行」をクリックしてデータの処理をすぐに開始できます。または、後でカタログでデータフローを検索し、「実行」右クリック・オプションを使用して、処理を開始することもできます。生成されたデータセットには、データ・フローと同じカタログ内のフォルダでアクセスできます。