機械翻訳について

データ・フローを使用したデータセットの作成

データ・フローを使用して、データをキュレートしデータセットを作成します。 たとえば、2つのデータセットをマージし、データをクレンジングし、新しいデータセットに結果を出力する場合があります。

  1. ホーム・ページで「作成」をクリックし、「データ・フロー」を選択します。
  2. 「データセットの追加」ダイアログで、データセットを選択し、「追加」をクリックします。
    「ステップの追加」(+)をクリックしてから、「データの追加」をクリックすると、いつでもデータ・ソースを追加できます。
  3. オプション: 「データの追加」ペインでデータを構成します。 たとえば、列を含めるまたは除外する、あるいは列の名前を変更します。
  4. データ・フローを構築します。
    実行する機能ごとに、「ステップの追加」(+)をクリックし、必要なステップ・タイプをクリックして、「ステップ・エディタ」ペインでプロパティを指定します。
    ヒント: 最後のステップにカーソルを合せると、「ステップの追加」(+)オプションが表示されます。 列ヘッダーの「オプション」を使用して、フローの編集やステップの追加を行うこともできます。 たとえば、列の名前変更、再フォーマット、マージまたは変換を行うことができます。
  5. 「データの保存」ステップをデータ・フローの最後に追加します。
    「データの保存」ステップを構成する場合は、オプションで「処理形式」および「デフォルト集計」列の設定を調整し、列の説明を追加できます。
  6. データ・フローを保存します。
    「データ・フローの実行」をクリックするか、後で「データ」ページの「データ・フロー」パネルを使用して(ホーム・ページで「ナビゲータ」ナビゲータの表示に使用される「ナビゲータ」アイコンをクリックし、「データ」をクリックして)データの処理を開始できます。 「データ」ページの「データセット」パネルで生成されたデータセットにアクセスできます。