プロジェクト・データ・セットへの変換スクリプトの適用

変換スクリプトを適用することにより、プロジェクト・データ・セットをいつでも変更できます。スクリプトの実行が終了したら、プロジェクトを使用しているユーザーは、ガイド付きナビゲーションを使用して、Studioの「変換」「検索」および「検出」領域で変換されたデータを操作できます。

変換したデータ・セットは、プロジェクト内でのみ使用できます。「コミット」操作により、「カタログ」に新しいデータ・セットが追加されたり、Hive内のソース・データが変更されることはありません。

注意: BDDによってソースHive表のデータ型が独自のデータ型に変換される方法が原因で、スクリプトをプロジェクトのデータ・セットに適用すると、一部のデータ型が省略される可能性があります。たとえば、Dgraphデータ型と一致しない複雑なHiveデータ型の一部が省略されます。詳細は、「データ型変換」を参照してください。

スクリプトをコミットするには、次を実行します。

「変換エディタ」で、変換スクリプトの下部にある「コミット」をクリックします。
「変換」はロックされ、操作が完了するまで数分かかる可能性があるという内容のメッセージが表示されます。スクリプトの実行が終了するまではページを離れたりリフレッシュしないでください。

スクリプトの実行が終了すると、「変換」に、スクリプトが成功したか失敗したかを示すメッセージが表示されます。成功した場合、「変換」をリフレッシュし、変換されたデータ・セットを表示できます。

変換スクリプトをコミットすると、Big Data Discovery内のデータ処理コンポーネントによって次が実行されます。
  1. 変換されたデータ・セットのスキーマをDgraphから取得します。
  2. 変換スクリプトを使用してデータを変換します。
  3. スキーマおよびメタデータに基づいて新しいプロジェクト・データ・セットを作成し、変換したデータをこのデータ・セットに移入します。

スクリプトをデータ・セットに適用した後も、スクリプトの操作を続行できます(Big Data Discovery内のプロジェクト・データ・セットはソースHive表のサンプルであることに注意してください)。また、変換スクリプトはデータ・セットに対して何回でも再適用できます。