3 Hadoopデータを統合する環境の設定

この章では、Hadoopデータを統合するための環境を設定するために実行する必要がある手順について説明します。

この章の内容は次のとおりです。

3.1 ビッグ・データ構成ウィザードの使用によるビッグ・データ・テクノロジの構成

ビッグ・データ構成ウィザードは、複数のHadoopテクノロジを設定するための単一のエントリ・ポイントを提供します。データ・サーバー、物理スキーマ、論理スキーマの作成、およびHadoop、HBase、Oozie、Spark、Hive、Pigといった各種Hadoopテクノロジに対するコンテキストの設定をすばやく実行できます。

様々な配置に対するデフォルトのメタデータ(プロパティやホスト名、ポート名など)、および環境変数のデフォルト値があらかじめ入力されています。これにより、これらのテクノロジに対する詳細な知識がなくても、データ・サーバーを物理および論理スキーマとともに簡単に作成できます。

すべてのテクノロジの構成が終わったら、データ・サーバーに対する設定を検証して接続ステータスをテストできます。

注意:

ビッグ・データ構成ウィザードを使用することを望まない場合、後続の項で言及されている情報を使用して手動でビッグ・データ・テクノロジ用にデータ・サーバーを設定できます。

ビッグ・データ構成ウィザードを実行するには、次の手順を実行します。

ODI Studioで、「ファイル」を選択し、「新規...」をクリックします。または
「トポロジ」タブ→「トポロジ」メニュー→「ビッグ・データ構成」を選択します。
新規ギャラリ・ダイアログで、「ビッグ・データ構成」を選択して「OK」をクリックします。
ビッグ・データ構成ウィザードが表示されます。
ウィザードの「一般設定」パネルで、必要なオプションを指定します。
詳細は、「一般設定」を参照してください。
「次」をクリックします。
「一般設定」パネルで選択した各テクノロジに対するデータ・サーバー・パネルが表示されます。
ウィザードの「Hadoop」パネルで、次を実行します。
- Hadoopデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「Hadoopデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
ウィザードの「HDFS」パネルで、次を実行します。
- HDFSデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「HDFSデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
ウィザードの「HBase」パネルで、次を実行します。
- HBaseデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「HBaseデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
ウィザードの「Spark」パネルで、次を実行します。
- Sparkデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「Sparkデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
ウィザードの「Kafka」パネルで、次を実行します。
- Kafkaデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「Kafkaデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
ウィザードの「Pig」パネルで、次を実行します。
- Pigデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「Pigデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
ウィザードの「Hive」パネルで、次を実行します。
- Hiveデータ・サーバーを作成するのに必要なオプションを指定します。
  
  詳細は、「Hiveデータ・サーバーの定義」を参照してください。
- 「プロパティ」セクションで、「+」アイコンをクリックしてデータ・サーバー・プロパティを追加します。
- 論理スキーマ、物理スキーマ、およびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
ウィザードの「Oozie」パネルで、次を実行します。
- Oozieランタイム・エンジンを作成するのに必要なオプションを指定します。
  
  詳細は、「Oozieランタイム・エンジン定義」を参照してください。
- 「プロパティ」セクションで、リストされているデータ・サーバーのプロパティを確認します。
  
  注意: 新しいプロパティを追加したり、リストされているプロパティを削除することはできません。ただし、必要に応じて、リストされているプロパティの値を変更できます。
  
  詳細は、「Oozieランタイム・エンジンのプロパティ」を参照してください。
- 論理エージェントおよびコンテキストを適切なドロップダウン・リストから選択します。
「次」をクリックします。
「すべての設定を検証」パネルで「すべての設定をテスト」をクリックして、データ・サーバーに対する設定を検証して接続ステータスを確認します。
「終了」をクリックします。

3.1.1 一般設定

次の表では、ビッグ・データ構成ウィザードの「一般設定」パネルで設定する必要があるオプションについて説明します。

表3-1 一般設定オプション

オプション	説明
接頭辞	接頭辞を指定します。この接頭辞はデータ・サーバー名、論理スキーマ名および物理スキーマ名に関連付けられています。
配布	配布を選択します。「手動」またはCDH <version>のいずれかです。
ベース・ディレクトリ	ベース・ディレクトリを指定します。このベース・ディレクトリは、ウィザードの他のすべてのパネルに自動的に移入されます。注意: このオプションは、配布が「手動」ではない場合にのみ表示されます。
分布タイプ	「標準」または「Kerberos化」のいずれかの配布タイプを選択します。
テクノロジ	構成するテクノロジを選択します。注意: 選択したテクノロジに対するデータ・サーバー作成パネルのみが表示されます。

ビッグ・データ構成ウィザードの使用によるビッグ・データ・テクノロジの構成

3.1.2 HDFSデータ・サーバーの定義

次の表では、HDFSデータ・サーバーを作成する際に指定する必要があるオプションについて説明します。

注意:

HDFSデータ・サーバーの定義に関する必須または固有のフィールドのみについて説明します。

表3-2 HDFSデータ・サーバーの定義

オプション	説明
名前	データ・サーバーの名前を入力します。この名前はOracle Data Integratorに表示されます。
ユーザー/パスワード	ユーザー名とそのパスワード。
Hadoopデータサーバー	HDFSデータ・サーバーに関連付けるHadoopデータ・サーバー。
追加クラスパス	追加のクラスパスを指定します。

3.1.3 HBaseデータ・サーバーの定義

次の表では、HBaseデータ・サーバーを作成する際に指定する必要があるオプションについて説明します。

注意: HBaseデータ・サーバーの定義に関する必須または固有のフィールドのみについて説明します。

表3-3 HBaseデータ・サーバーの定義

オプション	説明
名前	データ・サーバーの名前を入力します。この名前はOracle Data Integratorに表示されます。
HBase定数	HBaseインストールの定数。例: `localhost:2181`。
ユーザー/パスワード	ユーザー名とそのパスワード。
Hadoopデータサーバー	HBaseデータ・サーバーに関連付けるHadoopデータ・サーバー。
追加クラスパス	デフォルトでは、次のクラスパスが追加されます。 `/usr/lib/hbase/` `usr/lib/hbase/lib/` 必要に応じて、追加のクラスパスを指定します。

ビッグ・データ構成ウィザードの使用によるビッグ・データ・テクノロジの構成

3.1.4 Kafkaデータ・サーバーの定義

次の表では、Kafkaデータ・サーバーを作成する際に指定する必要があるオプションについて説明します。

注意:

Kafkaデータ・サーバーの定義に関する必須または固有のフィールドのみについて説明します。

表3-4 Kafkaデータ・サーバーの定義

オプション	説明
名前	データ・サーバーの名前を入力します。この名前はOracle Data Integratorに表示されます。
ユーザー/パスワード	ユーザー名とそのパスワード。
Hadoopデータサーバー	Kafkaデータ・サーバーに関連付けるHadoopデータ・サーバー。
追加クラスパス	次の追加のクラスパスがデフォルトで追加されます。 `/opt/cloudera/parcels/CDH/lib/kafka/libs/` `/opt/cloudera/parcels/CDH/lib/base dir` `basedir/lib/kafka/libs/` 必要に応じて、さらに追加のクラスパスを追加できます。注意: このフィールドは、ビッグ・データ構成ウィザードを使用してKafkaデータ・サーバーを作成する場合にのみ表示されます。

3.1.5 Kafkaデータ・サーバー・プロパティ

次の表では、新しいKafkaデータ・サーバーを作成する場合に「プロパティ」タブで追加する必要があるKafkaデータ・サーバー・プロパティについて説明します。

表3-5 Kafkaデータ・サーバー・プロパティ

キー	値
metadata.broker.list	PLAINTTEXTまたはSASL_PLAINTTEXTの2つの値があります。SASL_PLAINTTEXTは、Kerberos化されたKafkaサーバーに使用します。デフォルト値はPLAINTTEXTです。
oracle.odi.prefer.dataserver.packages	トピックおよびメッセージをKafkaサーバーから取得します。アドレスはoracle.odiです。

3.2 Hadoopデータ・サーバーの作成と初期化

Hadoopデータ・サーバーを作成および初期化するには、次の手順を実行します。

「トポロジ」タブをクリックします。
「物理アーキテクチャ」ツリーの「テクノロジ」で、「Hadoop」を右クリックして「新規データ・サーバー」をクリックします。
「定義」タブで、Hadoopデータ・サーバーの詳細を指定します。
詳細は、「Hadoopデータ・サーバーの定義」を参照してください。
「プロパティ」タブで、Hadoopデータ・サーバーのプロパティを指定します。
詳細は、「Hadoopデータ・サーバー・プロパティ」を参照してください。
「初期化」をクリックして、Hadoopデータ・サーバーを初期化します。
Hadoopデータ・サーバーを初期化すると、ODIマスター・リポジトリおよび作業リポジトリの構造がHDFSに作成されます。
「テスト接続」をクリックして、Hadoopデータ・サーバーへの接続をテストします。

3.2.1 Hadoopデータ・サーバーの定義

次の表は、新しいHadoopデータ・サーバーを作成する場合に「定義」タブで指定する必要があるフィールドについて説明しています。

注意: Hadoopデータ・サーバーの定義に関する必須または固有のフィールドのみについて説明します。

表3-6 Hadoopデータ・サーバーの定義

フィールド	説明
名前	Oracle Data Integratorに表示されるデータ・サーバーの名前。
データ・サーバー	データ・サーバーの物理名。
ユーザー/パスワード	Hadoopユーザーとそのパスワード。パスワードを指定しない場合、HDFSおよびOozieのユーザー名を使用した単純な認証のみが実行されます。
認証メソッド	認証方式として、次のいずれかを選択します。簡易ユーザー名認証 Kerberosプリンシパル・ユーザー名/パスワード Kerberos資格キャッシュ
HDFSノード名URI	HDFSノード名のURI。 `hdfs://localhost:8020`
リソース・マネージャ/ジョブ・トラッカURI	「リソース・マネージャまたはジョブ・トラッカのURI。 `localhost:8032`
ODI HDFSルート	ODI HDFSのルート・ディレクトリのパス。 `/user/<login_username>/odi_home`.
追加クラスパス	追加のクラスパスを指定します。次の追加クラスパスを追加します。 `/usr/lib/hadoop/` `/usr/lib/hadoop/lib/` `/usr/lib/hadoop-hdfs/` `/usr/lib/hadoop-mapreduce/` `/usr/lib/hadoop-yarn/` `/usr/lib/oozie/lib/` `/etc/hadoop/conf/`

Hadoopデータ・サーバーの作成および初期化

ビッグ・データ構成ウィザードの使用によるビッグ・データ・テクノロジの構成

3.2.2 Hadoopデータ・サーバー・プロパティ

次の表は、新しいHadoopデータ・サーバーを定義する場合に「プロパティ」タブで構成可能なプロパティについて説明しています。

注意: これらのプロパティは、HiveやHDFSといった他のHadoopテクノロジによる継承が可能です。これらのプロパティを継承するには、他のHadoopテクノロジのデータ・サーバーを作成する際に、この構成済のHadoopデータ・サーバーを選択する必要があります。

表3-7 HadoopおよびHiveに必須のHadoopデータ・サーバー・プロパティ

プロパティ	説明/値
HADOOP_HOME	Hadoopディレクトリの場所。例: `/usr/lib/hadoop`
HADOOP_CONF	Hadoop構成ファイル(core-default.xml、core-site.xml、hdfs-site.xmlなど)の場所。例: `/home/shared/hadoop-conf`
HIVE_HOME	Hiveディレクトリの場所。例: `/usr/lib/hive`
HIVE_CONF	Hive構成ファイル(hive-site.xmlなど)の場所。例: `/home/shared/hive-conf`
HADOOP_CLASSPATH	`$HIVE_HOME/lib/hive-metastore-.jar:$HIVE_HOME/lib/libthrift-.jar:$HIVE_HOME/lib/libfb.jar:$HIVE_HOME/lib/hive-exec-.jar:$HIVE_CONF`
HADOOP_CLIENT_OPTS	`-Dlog4j.debug -Dhadoop.root.logger=INFO,console -Dlog4j.configuration=file:/etc/hadoop/conf.cloudera.yarn/log4j.properties`
ODI_ADDITIONAL_CLASSPATH	`$HIVE_HOME/lib/'':$HADOOP_HOME/client/:$HADOOP_CONF`
HIVE_SESSION_JARS	`$HIVE_HOME/lib/hive-contrib-*.jar:<ODI library directory>/wlhive.jar` `wlhive.jar`の実際のパスは、ODIインストールのホームで決定できます。必要に応じて、他のJARファイル(カスタムSerDes JARファイルなど)を含めます。これらのJARファイルは各Hive JDBCセッションに追加され、それによって各Hive MapReduceジョブに追加されます。 JARのリストは":"で区切られ、ファイル名のワイルドカードを複数のファイルに評価することはできません。 Apache SentryなどのHadoopセキュリティ・モデルに関する手順に従って、ODI Hive KM内で使用されるHive ADD JARコールを許可します。環境変数HIVE_SESSION_JARSを空として定義します。 Hiveグローバル構成のhive-site.xmlで、Hiveに必要なJARをすべて追加します。

表3-8 (HadoopおよびHiveの基本プロパティ以外の) HBaseに必須のHadoopデータ・サーバー・プロパティ

プロパティ	説明/値
HBASE_HOME	HBaseディレクトリの場所。例: `/usr/lib/hbase`
HADOOP_CLASSPATH	`$HBASE_HOME/lib/hbase-.jar:$HIVE_HOME/lib/hive-hbase-handler.jar:$HBASE_HOME/hbase.jar`
ODI_ADDITIONAL_CLASSPATH	`$HBASE_HOME/hbase.jar`
HIVE_SESSION_JARS	`$HBASE_HOME/hbase.jar:$HBASE_HOME/lib/hbase-sep-api-.jar:$HBASE_HOME/lib/hbase-sep-impl-hbase.jar:/$HBASE_HOME/lib/hbase-sep-impl-common-.jar:/$HBASE_HOME/lib/hbase-sep-tools-.jar:$HIVE_HOME/lib/hive-hbase-handler-.jar` 注意: Apache SentryなどのHadoopセキュリティ・モデルに関する手順に従って、ODI Hive KM内で使用されるHive ADD JARコールを許可します。環境変数HIVE_SESSION_JARSを空として定義します。 Hiveグローバル構成のhive-site.xmlで、Hiveに必要なJARをすべて追加します。

表3-9 (HadoopおよびHiveの基本プロパティ以外の) Oracle Loader for Hadoopに必須のHadoopデータ・サーバー・プロパティ

プロパティ	説明/値
OLH_HOME	OLHインストールの場所。例: `/u01/connectors/olh`
OLH_FILES	`usr/lib/hive/lib/hive-contrib-1.1.0-cdh5.5.1.jar`
ODCH_HOME	OSCHインストールの場所。例: `/u01/connectors/osch`
HADOOP_CLASSPATH	`$OLH_HOME/jlib/:$OSCH_HOME/jlib/` OLHを使用するには、`HADOOP_CLASSPATH`内のHadoop jarをワイルドカードなしで手動で解決する必要があります。
OLH_JARS	Oracle Loader for Hadoopで使用されるカスタム入力形式、Hive、Hive SerDesなどに必要なすべてのJARファイルのカンマ区切りリスト。すべてのファイル名をワイルドカードなしで展開する必要があります。次に例を示します。 `$HIVE_HOME/lib/hive-metastore-0.10.0-cdh4.5.0.jar,$HIVE_HOME/lib/libthrift-0.9.0-cdh4-1.jar,$HIVE_HOME/lib/libfb303-0.9.0.jar`
OLH_SHAREDLIBS	`$OLH_HOME/lib/libolh12.so,$OLH_HOME/lib/libclntsh.so.12.1,$OLH_HOME/lib/libnnz12.so,$OLH_HOME/lib/libociei.so,$OLH_HOME/lib/libclntshcore.so.12.1,$OLH_HOME/lib/libons.so`
ODI_ADDITIONAL_CLASSPATH	`$OSCH_HOME/jlib/'*'`

表3-10 (HadoopおよびHiveの基本プロパティ以外の) SQOOPに必須のHadoopデータ・サーバー・プロパティ

プロパティ	説明/値
SQOOP_HOME	Sqoopディレクトリの場所。例: `/usr/lib/sqoop`
SQOOP_LIBJARS	SQOOPライブラリjarの場所。例: `usr/lib/hive/lib/hive-contrib-1.1.0-cdh5.5.1.jar`

Hadoopデータ・サーバーの作成および初期化

3.3 Hadoop物理スキーマの作成

『Oracle Data Integratorの管理』の物理スキーマの作成に関する項の説明に従って、標準の手順を使用してHadoop物理スキーマを作成します。

『Oracle Data Integratorの管理』の論理スキーマの作成に関する項の説明に従って、標準の手順を使用してこの物理スキーマ用の論理スキーマを作成し、特定のコンテキストで関連付けます。

3.4 Hadoopジョブを実行するためのOracle Data Integratorエージェントの構成

Hadoopジョブを実行するには、Oracle Data Integratorエージェントを構成する必要があります。

Oracle Data Integratorエージェントを設定する手順は次のとおりです。

HadoopをOracle Data Integratorエージェント・コンピュータにインストールします。
Oracle Big Data Applianceの場合、『Oracle Big Data Applianceソフトウェア・ユーザーズ・ガイド』でリモートHadoopクライアントの設定手順を参照してください。
HiveをOracle Data Integratorエージェント・コンピュータにインストールします。
SQOOPをOracle Data Integratorエージェント・コンピュータにインストールします。
ODIエージェント・コンピュータで、HadoopおよびHiveの基本プロパティを設定します。
これらのプロパティはHadoopデータ・サーバー・プロパティとして追加する必要があります。詳細は、「Hadoopデータ・サーバー・プロパティ」を参照してください。
HBase機能を使用する場合は、ODIエージェント・コンピュータでプロパティを設定します。HadoopおよびHiveの基本プロパティに加えて、これらのプロパティを設定する必要があります。
これらのプロパティはHadoopデータ・サーバー・プロパティとして追加する必要があります。詳細は、「Hadoopデータ・サーバー・プロパティ」を参照してください。

3.5 Oracle Loader for Hadoopの構成

Oracle Loader for Hadoopを使用するには、Oracle Data Integratorエージェント・コンピュータにOracle Loader for Hadoopをインストールして構成する必要があります。

Oracle Loader for Hadoopをインストールして構成するには、次の手順を実行します。

Oracle Loader for HadoopをOracle Data Integratorエージェント・コンピュータにインストールします。
『Oracle Big Data Connectorsユーザーズ・ガイド』のOracle Loader for Hadoopのインストールに関する項を参照してください。
Oracle SQL Connector for HDFS (OLH_OUTPUT_MODE=DP_OSCHまたはOSCH)を使用するには、まずこれをインストールする必要があります。
『Oracle Big Data Connectorsユーザーズ・ガイド』のOracle SQL Connector for Hadoop Distributed File Systemの設定に関する項を参照してください。
ODIエージェント・コンピュータでOracle Loader for Hadoopのプロパティを設定します。HadoopおよびHiveの基本プロパティに加えて、これらのプロパティを設定する必要があります。
これらのプロパティはHadoopデータ・サーバー・プロパティとして追加する必要があります。詳細は、「Hadoopデータ・サーバー・プロパティ」を参照してください。

3.6 保護されたクラスタに接続するためのOracle Data Integratorの構成

Kerberos認証で保護されるHadoopクラスタでOracle Data Integratorエージェントを実行するには、Kerberos保護クラスタを構成する必要があります。

Kerberos保護クラスタの使用手順:

Oracle Data Integratorエージェントが実行するOracle Big Data Applianceのnode04にログインします。
次のコマンドラインを使用して、環境変数を設定します。使用する製品に合せて適切な値を代入します。
$ export KRB5CCNAME=Kerberos-ticket-cache-directory

$ export KRB5_CONFIG=Kerberos-configuration-file

$ export HADOOP_OPTS="$HADOOP_OPTS -Djavax.xml.parsers.DocumentBuilderFactory=com.sun.org.apache.xerces.internal. jaxp.DocumentBuilderFactoryImpl-Djava.security.krb5.conf=Kerberos-configuration-file"

この例では、構成ファイルの名前はkrb5*で、/tmp/oracle_krb/にあります。

$ export KRB5CCNAME=/tmp/oracle_krb/krb5cc_1000

$ export KRB5_CONFIG=/tmp/oracle_krb/krb5.conf

$ export HADOOP_OPTS="$HADOOP_OPTS -D javax.xml.parsers.DocumentBuilderFactory=com.sun.org.apache.xerces.internal. jaxp.DocumentBuilderFactoryImpl -D java.security.krb5.conf=/tmp/oracle_krb/krb5.conf"
oracleユーザーの新しいKerberosチケットを作成します。次のコマンドを使用して、レルムをKerberosの実際のレルム名に置き換えます。
$ kinit oracle@realm
ODI Studio: ODI Studio用のVMを設定するには、odi.shと同じフォルダにあるodi.confでAddVmoptionを追加する必要があります。
Kerberos構成ファイルの場所は、次のとおりです。
```
AddVMOption -Djava.security.krb5.conf=/etc/krb5.conf
AddVMOption -Dsun.security.krb5.debug=trueAddVMOption -Dsun.security.krb5.principal=odidemo
```

次のような構文を使用して、JDBC接続URLを再定義します。

表3-11 データサーバー用のKerberos構成ファイル

テクノロジ	構成	例
Hadoop	特別な構成は行わず、一般設定で十分です。
Hive	`$MW_HOME/oracle_common/modules/datadirect/JDBCDriverLogin.conf`	構成ファイルの例 JDBC_DRIVER_01 { com.sun.security.auth.module.Krb5LoginModule required debug=true useTicketCache=true ticketCache="/tmp/krb5cc_500" doNotPrompt=true ; }; Hive URLの例 `jdbc:weblogic:hive://slc05jvn.us.oracle.com:10000;DatabaseName=default;AuthenticationMethod=kerberos;ServicePrincipalName=hive/slc05jvn.us.oracle.com@US.ORACLE.COM`
HBase	export HBASE_HOME=/scratch/shixu/etc/hbase/conf export HBASE_CONF_DIR = $HBASE_HOME/conf export HBASE_OPTS ="-Djava.security.auth.login.config=$HBASE_CONF_DIR/hbase-client.jaas"export HBASE_MASTER_OPTS ="-Djava.security.auth.login.config=$HBASE_CONF_DIR/hbase-server.jaas" ODI Studioの構成: `AddVMOption -Djava.security.auth.login.config=$HBASE_CONF_DIR/hbase-client.jaas"`	Hbase構成ファイルの例: hbase-client.jaas Client { com.sun.security.auth.module.Krb5LoginModule required useKeyTab=false useTicketCache=true; };
Spark	Spark Kerberosの構成は、Spark発行パラメータを使用して行います。 --principal // define principle name --keytab // location of keytab file	Spark発行コマンドの例: spark-submit --master yarn --py-files /tmp/pyspark_ext.py --executor-memory 1G --driver-memory 512M --executor-cores 1 --driver-cores 1 --num-executors 2 --principal shixu@US.ORACLE.com --keytab /tmp/shixu.tab --queue default /tmp/New_Mapping_Physical.py ./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster --num-executors 1 --driver-memory 512m --executor-memory 512m --executor-cores 1 lib/spark-examples*.jar 10
Kafka	Kafka Kerberosの構成は、kafka-client.jaasファイルを使用して行います。この構成ファイルは、Kafka構成フォルダにあります。	Kafka構成ファイルの例: KafkaClient { com.sun.security.auth.module.Krb5LoginModule required useKeyTab=false useTicketCache=true ticketCache="/tmp/krb5cc_1500" serviceName="kafka"; }; Kafka構成ファイルの場所は、ODI Studio VMオプションで設定します。 `AddVMOption -Djava.security.auth.login.config=/scratch/shixu/etc/kafka-jaas.conf"`
Pig/Oozie	PigおよびOoizeは、リンクされたHadoopデータ・サーバーのKerberos構成を拡張するため、特別な構成は必要ありません。

次のURLの『CDH5 Security Guide』の「HiveServer2 Security Configuration」も参照してください。

http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH5/latest/CDH5-Security-Guide/cdh5sg_hiveserver2_security.html

サービスの混乱を防ぐため、Oracleの使用にあわせてKerberosチケットを定期的に更新します。
JCE Unlimited StrengthのセキュリティJARをダウンロードします。
Oracle Big Data ApplianceでのKerberosの管理の詳細は、『Oracle Big Data Applianceソフトウェア・ユーザーズ・ガイド』を参照してください。

3.7 ローカル・エージェントでHadoopジョブを実行するためのOracle Data Integrator Studioの構成

Oracle Data Integrator Studioインストールのローカル・エージェントでHadoopジョブを実行するには、「Hadoopジョブを実行するためのOracle Data Integratorエージェントの構成」の設定手順を実行しますが、Oracle Data IntegratorのuserlibディレクトリにJARファイルをコピーします。

次に例を示します。

Linux: $USER_HOME/.odi/oracledi/userlibディレクトリ。

Windows: C:\Users\<USERNAME>\AppData\Roaming\odi\oracledi\userlibディレクトリ