注意: BDDによってソースHive表のデータ型が独自のデータ型に変換される方法が原因で、スクリプトをソース表に適用すると、一部のデータ型が省略される可能性があります。たとえば、Dgraphデータ型と一致しない複雑なHiveデータ型の一部が省略されます。詳細は、
「データ型変換」を参照してください。
新しいデータ・セットを作成するには、次を実行します。
スクリプトが成功した場合、新しいHive表が索引に追加され、新しいデータ・セットが
「カタログ」に表示されます。
新しいデータ・セットが「カタログ」に表示されない場合、スクリプトは失敗しました。データ処理のログをチェックすると、失敗した理由に関する詳細を確認できます。詳細は、「変換ロギング」を参照してください。
変換スクリプトをソースHive表に適用すると、Big Data Discovery内のデータ処理によって次が実行されます。
- 変換スクリプトをStudioから取得します。
- 変換されたプロジェクト・データ・セットのスキーマをDgraphから取得します。
- プロジェクト・データ・セットのスキーマを使用して新しいHive表(この例ではHT2という名前にします)を作成します。
- 元のソースHive表(HT1という名前にします)からデータを1行ずつHT2Hive表にロードすると同時に、ロードした行ごとに変換スクリプトを実行し、変換したデータをHT2として保存します。
- HT2 Hive表(これは、変換したデータを使用した新しいHive表です)をサンプリングし、生成されたデータ・セットを「カタログ」に追加します。