データ・ロード・オプション

BDDには、複数のデータ・ロードのオプションがあります。DP CLIでデータ・ロード・ワークフローを実行することでデータをロードできます。また、Studioでは、個人ファイルをアップロードしたり、JDBCソースからデータをインポートできます。

BDDへのデータの初期ロードの場合、次の3つの方法が存在します。
  1. Hive表のロード。DP CLIを実行すると、データ処理ワークフローが実行され、Hive表からBDDにデータがロードされます。
  2. 個人ファイルのアップロード。Studioでは、個人ファイルからデータ・セットをアップロードできます・。
  3. JDBCソースからのインポート。Studioでは、データ・セットをJDBCソースからインポートできます。

この図は、データ・ロード・オプションを示しています。

データ・ロード・オプション

また、サンプルまたは完全なデータをロードできます。サンプルから開始して完全なデータをロードすることもできます。「データ・ロードおよびサンプル・サイズ」を参照してください。