「カタログ」内のデータ・セットの更新について

Studioでは、「データ・セットのリロード」を使用して、Excel、区切りファイルまたはJDBCソース・タイプを持つデータ・セットを更新できます。リロード操作では、最後のリロードまたはデータ・セットの作成時以降、追加、変更または削除されたすべてのレコードおよび属性が含まれるようにデータ・セットが更新されます。

プロジェクトにデータ・セットを追加しても、Studioでは自動的にはリロードされません。プロジェクト内でデータ・セットが変換されたりロードされると、それはプライベート・コピーになります。

データ・セットを「カタログ」にリロードすると、プロジェクトがパブリック・コピーを使用している場合は、そのデータ・セットがStudioによって自動的にプロジェクトにリロードされます。

しかし、いったんプロジェクト内で変換されたデータ・セットは、そのプロジェクトに固有のコピーとなります。

「カタログ」内のこのデータ・セットのパブリック・バージョンがリロードされた場合(つまり、このパブリック・データ・セットの新しいバージョンが「カタログ」に表示される場合)、次にプロジェクトに入ると、このデータ・セットの最近更新されたパブリック・バージョンのプライベート・コピーを使用していることがStudioによって通知され、データ・セットの新しいバージョンへの変換スクリプトを再コミットして「データの更新の受入れ」を行うことが求められます。このコミットによって、リロード済パブリック・データ・セットの新しいプライベート・コピーが作成されます。変換スクリプトはそのプライベート・コピーに適用されます。

注意: Hive内で直接作成されたデータ・セットを更新するには、データ処理CLIを使用します。詳細は、データ処理ガイドを参照してください。