データ・セット・セキュリティ
この項では、データ・セットの保護に関するオプションについて説明します。
Sentry
Sentryは、Hadoopクラスタ内でロールベースの認可機能を提供するHadoopコンポーネントです。これは主に、ハイブ・データに対するきめ細かいアクセス制限に使用されます。
HDFS保存データ暗号化
HDFS保存データ暗号化は、
暗号化ゾーン
と呼ばれる暗号化ディレクトリにHDFSデータを格納する機能です。暗号化ゾーン内のファイルはすべて、クライアント側で暗号化と復号が透過的に行われます。つまり、復号されているデータがHDFSに保存されることはありません。
データ・セットのホワイトリストとブラックリスト
BDDのホワイトリストとブラックリストは、どのハイブ表をDP CLIで処理するかを決定します。ホワイトリストでは処理する表を指定し、ブラックリストでは無視する表を指定します。処理された表のみが、BDDとそのユーザーによって利用可能になります。
ユーザー・ロール
Studioユーザーにはアプリケーション全体にわたるロールが割り当てられ、これにより、ユーザーがアクセスできるアプリケーションの範囲と表示できるデータが決まります。Studio管理者はユーザー・ロールを割り当て、変更できます。
プロジェクト・ロール
Studioでは、プロジェクト・ロールによってプロジェクト・データおよび構成にアクセスできるユーザーが決まります。
プロジェクト・タイプ
Studioでは、プロジェクトにアクセスできるユーザーはプロジェクト・タイプによって決まります。
データ・セット権限
Studioではデータ・セットがどのように作成されたかによって、データ・セットのデフォルトのアクセス権が決まります。
カスタム変換スクリプトおよび可視化
ユーザーはStudioを使用してカスタムの可視化と変換スクリプトを作成できます。これにはユーザーによるコーディングが必要になります。これに備え、ユーザーが重要なデータにアクセスしないよう特別なセキュリティ対策が講じられています。
セキュリティ・マネージャ
セキュリティ・マネージャは、Studioでユーザーに表示を許可するデータをフィルタ抽出する機能です。Studioのセキュリティをさらに強化する場合は、コンポーネントSDKを使用してカスタムのセキュリティ・マネージャを作成し、特定のデータに対するアクセスを制限します。