サンプルまたは完全なデータ・セットをロードできます。 サンプルをロードすると、後で完全なデータ・セットに移動できます。 このトピックでは、サンプルから完全なデータ・セットを取得する方法の概要を示します。
--Incremental update
フラグでDP CLIを使用するか、Studioで「完全データ・セットのロード」を使用して、Hiveからソース・データ・セット全体をロードできます。 これで、BDDにフル・データ・セットを設定できます。
DP CLIによるサンプル・サイズの指定の詳細は、「データ処理ガイド」を参照してください。
個人ファイルからデータ・セットをロードする場合、またはJDBCソースからデータ・セットをインポートする場合は、すべてのデータがロードされます。 ただし、システム上の他の場所にもある可能性があるソース・データと比較した場合は、サンプルの可能性があります。
後でソースからデータ全体を追加する場合は、ファイルをロードするときにBDDによって作成されたHiveデータ・セットを検索できます。 次に、drop
コマンドを使用して、データ・セットをHueに配置し、そのデータ・セットをproduction Hive表に置き換えます。 その後、Studioのこの表で「完全データ・セットのロード」を実行できます。 これにより、完全なデータ・セットがロードされます。
このプロセスは、BDDアプリケーションの作成と呼ばれます。 この手順の詳細なステップは、「Studioユーザー・ガイド」でのBDDアプリケーションの作成に関するトピックを参照してください。