変換スクリプト・ワークフロー

高度なレベルで変換スクリプトを作成してデータに適用するには、次の手順が必要です。

  1. Big Data Discovery内のカスタム変換関数またはネイティブのGroovy言語を使用してカスタム変換を作成します。
  2. プレビュー・モードを使用して、変換をデバッグし、データに対するその影響を確認します。
  3. 変換を変換スクリプトに保存します。
  4. 個々の変換をソート、変更および削除することにより、変換スクリプトを編集します。
  5. プロジェクトの作成元のサンプル・データ・セットにスクリプトを適用します。これにより、プロジェクト・データ・セットのコピー(ソースHive表のサンプル)が更新され、Studioの「検出」領域で使用可能になります。ここでは、プロジェクト内の他のデータ・セットの場合と同じように、ガイド付きナビゲーションを使用してこのデータ・セット内を検索できます。
  6. プロジェクトの基礎となるソースHive表にスクリプトを適用します。これにより、新しいHive表が作成され、新しいデータ・セットがStudio内の「カタログ」に追加されます。