必須設定

bdd.confの最初の部分には必須の設定が含まれます。システムに固有の情報で、これらのプロパティを更新する必要があり、これを行わないとインストーラは失敗する場合があります。

必須セットの設定

この項では、値を指定する必要がある空白の設定について説明します。これらを設定しないと、インストールは失敗します。

構成プロパティ 説明
ORACLE_HOME クラスタ内の各ノードでBDDがインストールされる、BDDルート・ディレクトリへのパス。このディレクトリは存在していない必要があり、その親ディレクトリの権限は、755または775のいずれかに設定されている必要があります。

これは、データベースで必要なORACLE_HOME環境変数とは異なります。

重要: インストーラが、データ処理をホストするHadoopノードを含むBDDコンポーネントをホストするすべてのノードに、このディレクトリを作成できることを確認する必要があります。

インストール・マシンおよびWebLogic Serverをホストする他のすべてのノードにおいて、このディレクトリには少なくとも6GBの空き領域が必要です。Dgraphをホストするノードは1GB、データ処理をホストするノードは2GBの空き領域が必要です。

ORACLE_INV_PTR インストーラによって作成される、Oracleインベントリ・ポインタへの絶対パス。このファイルはORACLE_HOMEディレクトリに配置できません。

他のOracleソフトウェア製品がインストールされている場合、このファイルはすでに存在します。それを指すようにこのプロパティを更新します。

INSTALLER_PATH インストール・ソース・ディレクトリの絶対パス。これは、10GB以上の空き領域を含んでいる必要があります。

このプロパティは省略可能です。これを設定しない場合、環境変数INSTALLER_PATHとしてインストール・ソース・ディレクトリへのパスを設定するか、実行時にインストーラによって求められたときに入力できます。詳細は、「BDDインストーラ」を参照してください。

DGRAPH_INDEX_DIR DGRAPH_INDEX_NAMEによって定義されるDgraph索引が配置される共有NFS上のディレクトリのパス。これは、ORACLE_HOMEの下には配置できず、配置した場合削除されます。

既存の索引でインストールしている場合、このプロパティをその場所に設定します。そうではない場合、インストーラが空の索引を作成する場所にこれを設定します。このディレクトリが現在存在しない場合、スクリプトによって作成されます。

HADOOP_UI_HOST Hadoopマネージャをホストするサーバーの名前(Cloudera ManagerまたはAmbari)。
STUDIO_JDBC_URL Studioによる接続に必要なデータベースJDBC URL。
このプロパティには3つのテンプレートがあります。データベース・タイプに対応するテンプレートをSTUDIO_JDBC_URLにコピーし、データベースを指すようにURLを更新します。
  • MySQLデータベースがある場合、最初のテンプレートを使用し、次のようにURLを更新します。
    jdbc:mysql://<database hostname>:<port number>/<database name>?useUnicode=true&characterEncoding=UTF-8&useFastDateParsing=false
  • Oracleデータベースがある場合、最初のテンプレートを使用し、次のようにURLを更新します。
    jdbc:oracle:thin:@<database hostname>:<port number>:<database SID>
  • 本番環境にインストールしているわけではなく、インストーラによりHypersonicデータベースを作成する場合、3番目のテンプレートを使用します。スクリプトにより、URLで定義された場所にデータベースが作成されます。
注意: BDDでは、現在データベースの移行はサポートされません。デプロイメント後、別のデータベースに変更する方法は、データベース自体を再構成してBDDを再インストールすることのみです。

一般設定

この項では、すべてのコンポーネントおよびインストール・プロセス自体に関連する設定を構成します。

構成プロパティ 説明
INSTALL_TYPE ハードウェアおよびHadoopディストリビューションに従って、インストール・タイプを決定します。これには、次のいずれかを設定します。
  • CDH
  • HW

このドキュメントは、Oracle Big Data Appliance (BDA)またはOracle Public Cloud (OPC)インストールを対象としていないことに注意してください。Big Data Applianceにインストールする場合、『Oracle Big Data Applianceオーナーズ・ガイド リリース4 (4.3)』を参照してください。

CLUSTER_MODE 単一マシンにインストールするか、クラスタにデプロイするかを決定します。クラスタにインストールしている場合TRUEを、単一のマシンをインストールしている場合FALSEを使用します。
注意: 単一のマシンにインストールしている場合、「単一ノードのインストール」を参照してください。
JAVA_HOME JDKインストール・ディレクトリの絶対パス。これは、すべてのBDDサーバーで同じである必要があり、$JAVA_HOME環境変数と同じ値を持っている必要があります。

複数のバージョンのJDKがインストールされている場合、正しいものを指していることを確認してください。

TEMP_FOLDER_PATH インストール中に各ノードで使用される一時ディレクトリ。これは、すべてのBDDノードで既存のディレクトリを指す必要があります。

インストール・マシンおよびWebLogic ServerまたはDgraphをホストする他のすべてのノードにおいて、このディレクトリには少なくとも10GBの空き領域が必要です。データ処理をホストするノードは3GBの空き領域が必要です。

CDH/HDP設定

この項では、Hadoopに関連するプロパティについて説明します。インストーラは、これらのプロパティを使用して、ホスト・サーバーのURIおよび名前など、Hadoopコンポーネントに関する情報をマネージャに問い合せます。

構成プロパティ 説明および可能な設定
HADOOP_UI_PORT Hadoopマネージャを実行するサーバーのポート番号。
HADOOP_UI_CLUSTER_NAME マネージャにリストされるHadoopクラスタの名前。クラスタ名内の空白は%20に置き換えます。
HUE_URI Hueが実行されているノードのホスト名およびポート。形式は<hostname>:<port>です。このプロパティは、HDPクラスタの場合にのみ必要です。
HADOOP_CLIENT_LIB_PATHS Hadoopクライアント・ライブラリへの絶対パスのカンマ区切りリスト。
注意: HDPがある場合、インストールする前に、このプロパティの設定のみを行う必要があります。CDHがある場合、インストーラにより、必要なライブラリがダウンロードされ、このプロパティが自動的に設定されます。これには、インターネット接続が必要であることに注意してください。スクリプトが、ライブラリをダウンロードできない場合、この問題を解決するための手順については「Hadoopクライアント・ライブラリのダウンロードの失敗」を参照してください。
このプロパティには2つのHDPテンプレートがあります。HDPバージョンに対応するテンプレートをHADOOP_CLIENT_LIB_PATHSにコピーし、インストール・マシンにコピーしたクライアント・ライブラリを指すようにパスを更新します。
  • 2.2.4がある場合、2番目のテンプレートを使用します。
  • 2.3がある場合、3番目のテンプレートを使用します。

パスは表示されるとおりに指定する必要があるため、リスト内のパスの順序は変更しないでください。

Kerberos設定

この項では、BDDのKerberosを構成します。

注意: Kerberosを有効にする場合、これらのプロパティの変更のみが必要です。
構成プロパティ 説明および可能な設定
ENABLE_KERBEROS BDDクラスタでKerberosを有効にします。クラスタにKerberos 5+がインストールされていて、これにBDDを統合する場合は、この値をTRUEに設定します。そうでない場合は、FALSEに設定します。
KERBEROS_PRINCIPAL BDDプリンシパルの名前。これには、ドメインの名前を含める必要があります。例: bdd-service@EXAMPLE.COM

このプロパティが必要になるのは、ENABLE_KERBEROSTRUEに設定されている場合のみです。

KERBEROS_KEYTAB_PATH インストール・マシンのBDD keytabファイルへの絶対パス。

インストーラは、これをbdd.keytabに名前変更し、すべてのBDDノードの$BDD_HOME/common/kerberos/にコピーします。

このプロパティが必要になるのは、ENABLE_KERBEROSTRUEに設定されている場合のみです。

KRB5_CONF_PATH インストール・マシン上のkrb5.confファイルへの絶対パス。インストーラは、これをすべてのBDDノードの/etcにコピーします。

このプロパティが必要になるのは、ENABLE_KERBEROSTRUEに設定されている場合のみです。

WebLogicの設定

このセクションでは、管理サーバーおよびすべての管理対象サーバーを含む、WebLogic Serverを構成します。

構成プロパティ 説明および可能な設定
ADMIN_SERVER 管理サーバーになるインストール・マシンのホスト名。

これを空白にした場合、現在のマシンのホスト名がデフォルトとして設定されます。

MANAGED_SERVERS 管理対象サーバー・ホスト名(WebLogic、StudioおよびDgraph Gatewayを実行するサーバー)のカンマ区切りのリスト。このリストには管理サーバーのホスト名が含まれる必要があり、重複する値を含めることはできません。

DgraphおよびHDFSエージェントの設定

このセクションでは、DgraphおよびHDFSエージェントを構成します。

構成プロパティ 説明および可能な設定
DGRAPH_SERVERS Dgraphホスト名のカンマ区切りリスト。インストーラにより、Dgraphがこれらのノードにインストールされます。

このリストは重複する値を含むことはできず、YARNワーカー・ノードのホスト名を含むこともできません。

DGRAPH_THREADS Dgraphの起動に使用されるスレッドの数。次が推奨されます。
  • Dgraphのみが稼働するマシンの場合、スレッドの数はマシンのCPUコアの数と等しくします。
  • Dgraphおよび他のBDDコンポーネントが稼働するマシンの場合、スレッドの数はCPUコアの数から2を引いた値です。たとえば、4コアのマシンは2つのスレッドを持つ必要があります。

2より大きい値を指定してください。使用する数は必ずライセンス契約に従います。

このプロパティを空白にした場合、CPUコア数から2を引いた数がデフォルトとして設定されます。

DGRAPH_CACHE Dgraphキャッシュのサイズ(MB)。数値のみを指定し、MBは含めないでください。

このプロパティを空白にした場合、ノードの使用可能なRAMの50%または空きメモリー量の合計から2GBを引いた値(いずれか大きい方)がデフォルトとして設定されます。

ノードの使用可能なRAMの少なくとも50%をDgraphキャッシュに割り当てることをお薦めします。後から、処理に使用できるメモリーが十分でないために問合せが取り消されていることがわかった場合は、この量を徐々に減らしてください。

COORDINATOR_INDEX ZooKeeperによって識別に使用されるZooKeeperアンサンブル内のDgraphクラスタの索引。

このプロパティはDgraph索引とは関係ないことに注意してください。

DGRAPH_INDEX_NAME Dgraph索引の名前。Dgraph索引はDGRAPH_INDEX_DIRで定義されたディレクトリに配置されます。

索引がある場合、これをその名前に設定しますが、_indexesは含めないでください。

注意: 索引の名前がたまたまbaseだった場合、インストールする前に名前変更する必要があります。そうしない場合、インストーラによって、空の索引で上書きされます。

索引がない場合、このプロパティをbaseに設定されたままにします。これにより、インストーラはDGRAPH_INDEX_DIR内にbase_indexesという名前の空の索引を作成します。

データ処理の設定

このセクションでは、データ処理およびHive表ディテクタを構成します。

構成プロパティ 説明および可能な設定
HDFS_DP_USER_DIR ユーザーがBDDからデータをエクスポートすると作成されるAvroファイルを格納するHDFS /userディレクトリ内の場所。このディレクトリがまだ存在しない場合、インストーラによって作成されます。このディレクトリの名前に空白およびスラッシュ(/)を含めることはできません。
YARN_QUEUE データ処理ジョブの送信先のYARNキュー。
HIVE_DATABASE_NAME Studioデータ・セットのソース・データを格納するHiveデータベースの名前。

デフォルト値は、defaultです。これは、Hive表ディテクタで使用されるDETECTOR_HIVE_DATABASEのデフォルト値と同じです。これらのプロパティに異なるデータベースを使用することはできますが、初回インストールのもので始めることをお薦めします。

SPARK_ON_YARN_JAR Hadoopノード上のSpark on YARN jarへの絶対パス。これは、CLIクラスパスに追加されます。
このプロパティには3つのテンプレートがあります。Hadoopディストリビューションに対応するテンプレートの値をSPARK_ON_YARN_JARにコピーして、次のようにその値を更新します。
  • CDH 5.3または5.4がある場合、最初のテンプレートを使用して、それをspark-assembly.jarへの絶対パスに設定します。
  • HDP 2.2.xがある場合、2番目のテンプレートを使用して、それをhive-exec.jarおよびspark-assembly.jarへの絶対パスに、コロンで区切って設定します。
    <path/to/hive-exec.jar>:<path/to/spark-assembly.jar>
  • HDP 2.3がある場合、3番目のテンプレートを使用して、それをhive-metastore.jarのHiveバージョンおよびspark-assembly.jarへの絶対パスに、コロンで区切って設定します。
    <path/to/hive-metastore.jar>:<path/to/spark-assemply.jar>