次の図は、Hiveからのデータ処理によってロードされたデータ・セットを示しています。これは、DP CLIを使用してこのデータ・セットをどのように更新し、サンプルから完全にサイズを増加できるかを示しています。
スクリプト化された更新を実行するには、Studioのデータ・セットのプロパティにあるデータ・セット・キーが必要です。正しいデータ・セット・キーをDP CLIに指定することが重要です。データ・セットが「カタログ」にある場合、そのデータ・セットはプロジェクトにあるデータ・セットと異なります。正しいデータ・セット・キーに注意してください。
データ・セットをプロジェクトに移動して、完全なデータをロードした場合は、ブランチ・バージョンのデータ・セットをバージョン管理で作成することと同じになります。次に、DP CLIのデータのリフレッシュおよび増分更新のコマンドを使用して、スクリプト化された更新をこのデータ・セットに書き込むことができます。これらの更新をcronジョブとして定期的に実行できます。更新は、このプロジェクトのこのデータ・セットのローカル・バージョンで実行されます。このため、このデータ・セットのバージョンは「カタログ」に表示されるデータ・セットのバージョンとは無関係です。
このワークフローでは、このデータ・セットに基づいて独自のプロジェクトを作成し、スクリプト化された更新をDP CLIで実行できます。このアプローチは、新しいデータを保持および移入するBDDプロジェクトでも十分に機能します。
これにより、Studioで構築済の構成および視覚化の使用を続行して、新しいデータの取得時に分析できます。