Big Data Discoveryのデータ・セット
データ・セットについて
BDDのデータ・セットは
BDDデータ・セット
と呼ばれます。これにより、Hive表の
ソース・データ・セット
と区別することができます。
「カタログ」のデータ・セットとプロジェクトのデータ・セット
「カタログ」のデータ・セットとプロジェクトに取り込むデータ・セットは区別することが重要です。
データ・セット・マネージャ
Studioでは、すべてのプロジェクト・データ・セットの情報が「データ・セット・マネージャ」に表示されます。
サンプリングされた完全なデータ・セット
BDDのデータ・セットは、サンプリングしたり、完全なデータ・セットを表すことができます。
Studioのデータ・セット・ライフサイクル
データ・セットはBig Data Discovery内を移動するため、その途中の処理を知っておくと役に立ちます。
Big Data Discoveryのプロジェクトとアプリケーション
BDDでデータ・セットを操作する場合は、Studioのプロジェクトに配置します。これらはBDDプロジェクトと呼ばれます。一部のBDDプロジェクトは、BDDアプリケーションになる場合もあります。
データ・セット・アクセス、プロジェクトへのアクセスおよびユーザー・ロール
データ・セットはパブリックのものとプライベートのものがあります。データ・セットを「カタログ」または検索結果に表示する、データを検索する、またはプロジェクトに追加するには、データ・セットへのアクセス権が必要です。プロジェクトもパブリックのものとプライベートのものがあります。プロジェクト・タイプはStudioの管理者が設定します。