変換済データからの新しいデータ・セットの作成

変換されたデータを使用して、新しいデータ・セットを「カタログ」に作成できます。これは、データ・セットの分岐と呼ばれることもあります。作成した新しいデータ・セットには、元のデータ・セットのデータに対する変更は反映されません。

変換は、新しいデータ・セット全体に適用されます。次に、新しいデータ・セットの新しいサンプルが生成されます。

変換済データから新しいデータ・セットを作成するには、次の手順を実行します。

  1. 変換スクリプト・メニューで「データ・セットの作成」を選択します。
    次に例を示します。
    Studioの「データ・セットの作成」を表示します。

    ダイアログの一番上のグリッドは、現在の変換スクリプトに基づいてデータのプレビューが表示されます。

  2. 「新規データ・セット名」フィールドに、新しいデータ・セットの名前を入力します。
  3. 必要であれば、新しいデータ・セットの備考を新規データ・セットの説明フィールドに指定します。
  4. 「新規Hive表名」フィールドに、Hiveデータベースでのこのデータ・セットのための表名を指定します。
    デフォルトでは、表名はデータ・セット名と同じになります。
  5. 必要であれば、新規Hive表データ・ディレクトリ・フィールドを変更します。
    デフォルトでは、新しい表は/user/bbdに格納されます。たとえば、customersという名前の新しいデータ・セットを作成すると、/user/bbd/customersとして格納されます。
  6. 「保存」をクリックします。
  7. 「OK」をクリックして情報メッセージを閉じます。
    (このプロセスの進捗をチェックするには、Oozie Web UIツールを確認してください。)
BDDによって、Hiveデータベースでの新しい表の作成と、その他のデータ処理の実行が完了すると、データ・セットが「カタログ」で使用可能になります。