DP CLIを使用して更新のリフレッシュおよび増分更新を実行することで、データ・セットを更新できます。
最初に作成されたBDDデータ・セットはサンプリングされる場合があります。つまり、BDDデータ・セットのレコードはソースHive表のレコード数より少なくなります。 また、ソースHive表にレコードを追加でき、これらの新しいレコードはデフォルトではデータ・セットに追加されません。
DP CLIのリフレッシュの更新は、Studioで「完全データ・セットのロード」の機能を使用して行うことができる点に注意してください。 ただし、Studioではこの機能がサポートされていないため、増分データ更新はDP CLIを介してのみ実行できます。
データ・セットの再指定
ソース・データをStudioにアップロードし、リフレッシュと増分更新を実行することによってデータ・セットを作成した場合は、ソース・データ・セットを新しいHive表を指すように変更する必要があります。 (データ・セットがHiveで直接作成された表に基づいている場合、この変更は必要ありません。) この再起動操作の詳細は、「Studioユーザー・ガイド」でプロジェクトをBDDアプリケーションに変換する方法のトピックを参照してください。