このトピックの図は、HiveからBDDのデータ処理コンポーネントによってロードされるデータ・セットを示しています。 この図は、DP CLIを使用してこのデータ・セットを更新する方法と、サンプルから完全にサイズを増やす方法を示しています。
Refresh Data
およびIncremental Update
。
スクリプト更新を実行するには、Studioのデータ・セット・プロパティにあるデータ・セット論理名が必要です。 DP CLIに対して正しいデータ・セット論理名を指定することが重要です。 データ・セットがカタログ内にある場合、プロジェクト内にあるものと同じデータ・セットではありません。 データ・セットの論理名が正しいことに注意してください。
Incremental Update
を実行することはできません。データ・セットをプロジェクトに追加するときにのみ実行できます。
Incremental Update
を実行できます。 このためには、データ・セットをStudioのプロジェクトに移動する必要があります。
Refresh data
およびIncremental update
を使用して、このデータ・セットのスクリプト更新を記述できます。 これらの更新は、cron
ジョブとして定期的に実行できます。 更新は、このプロジェクトのこのデータ・セットの個人バージョンで実行されます。 これにより、このデータ・セットのバージョンは、カタログに表示されるデータ・セットのバージョンとは無関係です。
このワークフローでは、このデータ・セットに基づいて独自のプロジェクトを作成し、DP CLIでスクリプト更新を実行できます。 この方法は、新規データを回避して移入するBDDプロジェクトに適しています。
これにより、Studioで以前に作成した構成とビジュアライゼーションを引き続き使用し、新しいデータをその到着時に分析できます。