プロジェクト・データ・セットに対する変換スクリプトの実行

プロジェクトのデータ・セットに対して変換スクリプトを実行するまで、プロジェクトのフル・データ・セットは変換によって影響を受けません。その時までは、Studioでは、プロジェクトに現在関連付けられているデータ・サンプルに変換がコミットされます。また、後でサンプル・サイズを変更した場合、すでに適用した変換はサンプルに自動的に適用されます。

変換したデータ・セットは、プロジェクト内でのみ使用できます。「コミット」操作により、「カタログ」に新しいデータ・セットが追加されたり、Hive内のソース・データが変更されることはありません。

注意: BDDによってソースHive表のデータ型が独自のデータ型に変換される方法が原因で、スクリプトをプロジェクトのデータ・セットに適用すると、一部のデータ型が省略される可能性があります。たとえば、Dgraphデータ型と一致しない複雑なHiveデータ型の一部が省略されます。詳細は、「データ型変換」を参照してください。

プロジェクト・データ・セットに対して変換スクリプトを実行するには、次の手順を実行します。

  1. 「カタログ」でプロジェクトを選択します。
  2. 「変換」を選択します。
  3. まだコミットされていない変換がプロジェクトに含まれていることを示す灰色のバブルをクリックして、「変換スクリプト」パネルを展開します。
  4. 「プロジェクトにコミット」をクリックします。
「プロジェクトへのコミット」によって、プロジェクトのデータ・セットに対する変換が実行されますが、他のStudioユーザーの「カタログ」に表示される、基礎となるデータ・セットは変更されません。つまり、その他のStudioユーザーは、変換されていないデータ・セットを「カタログ」で探索できますが、プロジェクト・ユーザーは変換済データ・セットを探索できます。

変換を実行し、その他のStudioユーザーも変換結果を使用できるようにするには、変換をプロジェクトにコミットしてから新しいデータ・セットを作成します。生成される新しいデータ・セットには変換による変更が含まれ、「カタログ」で使用可能になります。「変換済データからの新しいデータ・セットの作成」を参照してください。