必須設定

bdd.confの最初の部分には必須の設定が含まれます。システムに固有の情報で、これらのプロパティを更新する必要があり、これを行わないとインストーラは失敗する場合があります。

必須設定

この項では、値を指定する必要がある空白の設定について説明します。これらを設定しないと、インストールは失敗します。

構成プロパティ 説明
ORACLE_HOME クラスタ内の各ノードでBDDがインストールされる、BDDルート・ディレクトリへのパス。このディレクトリは存在していない必要があります。インストーラがそれを作成できるようにするには、親ディレクトリの権限に755または775を設定し、各BDDノードで少なくとも30GBの領域が使用可能である必要があります。

これは、Studioデータベースで必要なORACLE_HOME環境変数とは異なります。

ORACLE_INV_PTR インストーラによって作成される、Oracleインベントリ・ポインタへの絶対パス。このファイルはORACLE_HOMEディレクトリに配置できません。

他のOracleソフトウェア製品がインストールされている場合、このファイルはすでに存在します。それを指すようにこのプロパティを更新します。

INSTALLER_PATH オプションです。インストール・ソース・ディレクトリの絶対パス。これは、10GB以上の空き領域を含んでいる必要があります。

このプロパティを設定しない場合は、INSTALLER_PATH環境変数を設定するか、実行時にパスを指定できます。詳細は、「インストールの概要」を参照してください。

DGRAPH_INDEX_DIR Dgraphデータベースへの絶対パス。このディレクトリは、ORACLE_HOMEの下には配置できず、配置した場合削除されます。

このディレクトリが現在存在しない場合、スクリプトによって作成されます。既存データベースとともにインストールしている場合は、このプロパティをそれらの親ディレクトリに設定します。

HDFS保存データ暗号化をHadoopで有効にし、データベースをHDFSに格納する場合は、暗号化ゾーン内であることを確認してください。

HADOOP_UI_HOST Hadoopマネージャ(Cloudera Manager、AmbariまたはMCS)をホストするサーバーの名前。
STUDIO_JDBC_URL StudioデータベースのJDBC URL。
このプロパティには3つのテンプレートがあります。データベース・タイプに対応するテンプレートをSTUDIO_JDBC_URLにコピーし、データベースを指すようにURLを更新します。
  • MySQLデータベースの場合は、最初のテンプレートを使用し、次のようにURLを更新します。
    jdbc:mysql://<database hostname>:<port number>/<database name>?useUnicode=true&characterEncoding=UTF-8&useFastDateParsing=false
  • Oracleデータベースの場合は、最初のテンプレートを使用し、次のようにURLを更新します。
    jdbc:oracle:thin:@<database hostname>:<port number>:<database SID>
  • 本番環境にインストールしているわけではなく、インストーラによりHypersonicデータベースを作成する場合、3番目のテンプレートを使用します。スクリプトにより、URLで定義された場所にデータベースが作成されます。

複数のマシンにインストールしている場合は、localhostではなくデータベース・ホストのFQDNを使用してください。

WORKFLOW_MANAGER_JDBC_URL ワークフロー・マネージャ・サービス・データベースのJDBC URL。
このプロパティには2つのテンプレートがあります。データベース・タイプに対応するテンプレートをWORKFLOW_MANAGER_JDBC_URLにコピーし、データベースを指すようにURLを更新します。
  • MySQLデータベースの場合は、最初のテンプレートを使用し、次のようにURLを更新します。
    jdbc:mysql://<database hostname>:<port number>/<database name>?useUnicode=true&characterEncoding=UTF-8&useFastDateParsing=false
  • Oracleデータベースの場合は、最初のテンプレートを使用し、次のようにURLを更新します。
    jdbc:oracle:thin:@<database hostname>:<port number>:<database SID>

複数のマシンにインストールしている場合は、localhostではなくデータベース・ホストのFQDNを使用してください。

一般

この項では、すべてのコンポーネントおよびインストール・プロセス自体に関連する設定を構成します。

構成プロパティ 説明
INSTALL_TYPE ハードウェアおよびHadoopディストリビューションに従って、インストール・タイプを決定します。これには、次のいずれかを設定します。
  • CDH
  • HW
  • MAPR

このドキュメントは、Oracle Big Data Appliance (BDA)またはOracle Public Cloud (OPC)のインストールを対象としていません。Big Data Applianceにインストールする場合、『Oracle Big Data Applianceオーナーズ・ガイド リリース4 (4.6)』および対応するMOS注記を参照してください。

JAVA_HOME JDKインストール・ディレクトリの絶対パス。これは、すべてのBDDサーバーで同じである必要があり、$JAVA_HOME環境変数と同じ値を持っている必要があります。

複数のバージョンのJDKがインストールされている場合、正しいものを指していることを確認してください。

TEMP_FOLDER_PATH インストール中に各ノードで使用される一時ディレクトリ。このディレクトリはすべてのBDDノードに存在している必要があり、20GB以上の空き領域を含んでいる必要があります。

CDH/HDP/MapR

この項では、Hadoopに関連するプロパティについて説明します。インストーラは、これらのプロパティを使用して、ホスト・サーバーのURIおよび名前など、Hadoopコンポーネントに関する情報をHadoopクラスタ・マネージャ(Cloudera Manager、AmbariまたはMCS)に問い合せます。

構成プロパティ 説明および可能な設定
HADOOP_UI_PORT Hadoopクラスタ・マネージャを実行するサーバーのポート番号。
HADOOP_UI_CLUSTER_NAME クラスタ・マネージャにリストされるHadoopクラスタの名前。クラスタ名内の空白は%20に置き換えます。
HUE_URI HDPのみ。Hueが実行されているノードのホスト名およびポート。形式は<hostname>:<port>です。
HADOOP_CLIENT_LIB_PATHS Hadoopクライアント・ライブラリへの絶対パスのカンマ区切りリスト。
注意: HDPまたはMapRがある場合、インストールする前に、このプロパティの設定のみを行う必要があります。CDHの場合、インストーラにより、必要なライブラリがダウンロードされ、このプロパティが自動的に設定されます。これには、インターネット接続が必要であることに注意してください。スクリプトが、ライブラリをダウンロードできない場合、この問題を解決するための手順については「Hadoopクライアント・ライブラリのダウンロードの失敗」を参照してください。

このプロパティを設定するには、HadoopディストリビューションのテンプレートをHADOOP_CLIENT_LIB_PATHSにコピーし、インストール・マシンにコピーしたクライアント・ライブラリを指すようにパスを更新します。<UNZIPPED_XXX_BASE>を正しいライブラリへの絶対パスにすべて置き換えます。

パスは表示されるとおりに指定する必要があるため、リスト内のパスの順序は変更しないでください。

HADOOP_CERTIFICATES_PATH TLS/SSLが有効になっているHadoopクラスタにのみ必要です。HDFS、YARN、HiveおよびKMSの証明書を配置したインストール・マシン上のディレクトリへの絶対パス。

このディレクトリは証明書を更新する必要がある場合に使用するため、インストール後に削除しないでください。

Kerberos

この項では、BDDのKerberosを構成します。これらのプロパティは、Kerberosを有効にする場合にのみ変更します。

構成プロパティ 説明および可能な設定
ENABLE_KERBEROS BDDクラスタでKerberosを有効にします。クラスタにKerberosがインストールされていて、これにBDDを統合する場合は、この値をTRUEに設定します。そうでない場合は、FALSEに設定します。
KERBEROS_PRINCIPAL BDDプリンシパルの名前。これには、ドメインの名前を含める必要があります。例: bdd-service@EXAMPLE.COM

このプロパティが必要になるのは、ENABLE_KERBEROSTRUEに設定されている場合のみです。

KERBEROS_KEYTAB_PATH インストール・マシンのBDD keytabファイルへの絶対パス。

インストーラは、これをbdd.keytabに名前変更し、すべてのBDDノードの$BDD_HOME/common/kerberos/にコピーします。

このプロパティが必要になるのは、ENABLE_KERBEROSTRUEに設定されている場合のみです。

KRB5_CONF_PATH インストール・マシン上のkrb5.confファイルへの絶対パス。インストーラは、これをすべてのBDDノードの/etcにコピーします。

このプロパティが必要になるのは、ENABLE_KERBEROSTRUEに設定されている場合のみです。

WebLogic (BDDサーバー)

このセクションでは、管理サーバーおよびすべての管理対象サーバーを含む、WebLogic Serverを構成します。

構成プロパティ 説明および可能な設定
ADMIN_SERVER 管理サーバーになるインストール・マシンのホスト名。

これを空白にした場合、現在のマシンのホスト名がデフォルトとして設定されます。

MANAGED_SERVERS 管理対象サーバー・ホスト名(WebLogic、StudioおよびDgraph Gatewayを実行するサーバー)のカンマ区切りのリスト。このリストには管理サーバーが含まれる必要があり、重複する値を含めることはできません。

複数の管理対象サーバーを定義する場合は、インストール後に、それらの前にロード・バランサを設定する必要があります。詳細は、「Studioのロード・バランシングの構成」を参照してください。

DgraphおよびHDFSエージェント

このセクションでは、DgraphおよびHDFSエージェントを構成します。

構成プロパティ 説明および可能な設定
DGRAPH_SERVERS DgraphおよびDgraph HDFSエージェントを実行するノードのホスト名のカンマ区切りのリスト。

このリストには重複する値を含めることはできません。データベースをHDFSに格納する予定の場合、これらはHDFS DataNodesである必要があります。最善のパフォーマンスのために、これらのノード上で実行されるその他のHadoopサービス(特にSpark)にはしないでください。

DGRAPH_THREADS Dgraphの起動に使用されるスレッドの数。これは、2以上にする必要があります。正確な数は、マシン上で実行されるその他のサービスによって異なります。
  • Dgraphのみを実行するマシンでは、スレッド数は、マシン上のコアの数に等しくします。
  • Dgraphと他のBDDコンポーネントを実行するマシンでは、スレッド数は、コアの数から2を引いた数にします。たとえば、4コア・マシンには、2つのスレッドが必要です。
  • Dgraphを実行するHDFSノードの場合、スレッド数は、CPUコア数からHadoopサービスに必要な数を引いた数にします。たとえば、2つのコアを必要とする、Hadoopサービスを実行する4コア・マシンには、2つのスレッドが必要です。

このプロパティを空白にした場合、CPUコア数から2を引いた数がデフォルトとして設定されます。

使用する数は必ずライセンス契約に従います。

DGRAPH_CACHE Dgraphキャッシュのサイズ(MB)。数値のみを指定し、MBは含めないでください。

このプロパティを空白にした場合、ノードの使用可能なRAMの50%または空きメモリー量の合計から2GBを引いた値(いずれか大きい方)がデフォルトとして設定されます。

ノードの使用可能なRAMの少なくとも50%をDgraphキャッシュに割り当てることをお薦めします。後から、処理に使用できるメモリーが十分でないために問合せが取り消されていることがわかった場合は、この量を徐々に減らしてください。

ZOOKEEPER_INDEX ZooKeeperによって識別に使用されるZooKeeperアンサンブル内のDgraphクラスタの索引。

データ処理

このセクションでは、データ処理およびHive表ディテクタを構成します。

構成プロパティ 説明および可能な設定
HDFS_DP_USER_DIR Studioユーザーがデータをエクスポートすると作成されるサンプル・ファイルを格納するHDFS /userディレクトリ内の場所。このディレクトリの名前に空白およびスラッシュ(/)を含めることはできません。それがまだ存在しない場合、インストーラによって作成されます。

MapRがあり、既存のディレクトリを使用する場合は、それをボリュームでマウントする必要があります。

YARN_QUEUE データ処理ジョブの送信先のYARNキュー。
HIVE_DATABASE_NAME Studioデータ・セットのソース・データを格納するHiveデータベースの名前。

デフォルト値は、defaultです。これは、Hive表ディテクタで使用されるDETECTOR_HIVE_DATABASEのデフォルト値と同じです。これらのプロパティに異なるデータベースを使用することはできますが、初回インストールのもので始めることをお薦めします。

SPARK_ON_YARN_JAR Hadoopノード上のSpark on YARN JARへの絶対パス。これは、CLIクラスパスに追加されます。
このプロパティには2つのテンプレートがあります。Hadoopディストリビューションに対応するテンプレートの値をSPARK_ON_YARN_JARにコピーして、次のようにその値を更新します。
  • CDHがある場合は、最初のテンプレートを使用します。これはspark-assembly.jarへの絶対パスである必要があります。
  • HDPの場合は、2番目のテンプレートを使用します。これは、コロンで区切られた、hive-metastore.jarhive-exec.jarおよびspark-assembly.jarへの絶対パスである必要があります。
    <path/to/hive-metastore.jar>:<path/to/hive-exec.jar>:<path/to/spark-assembly.jar>
  • MapRがある場合は、3番目のテンプレートを使用します。これはspark-assembly-1.5.2-mapr-1602-hadoop2.7.0-mapr-1602.jarへの絶対パスである必要があります。

このJARは、すべてのHadoopノード上で同じ場所にある必要があります。

小さいサービス

このセクションでは、変換サービスを構成します。

構成プロパティ 説明および可能な設定
TRANSFORM_SERVICE_SERVERS 変換サービス・ノードのカンマ区切りのリスト。

最善のパフォーマンスのためには、これらはすべて管理対象サーバーである必要があります。特に、Dgraphノードにはしないでください。これは、Dgraphにも変換サービスにも大量のメモリーが必要となるためです。

複数の変換サービス・ノードを定義する場合は、インストール後に、それらの前にロード・バランサを設定する必要があります。手順については、「変換サービスのロード・バランシングの構成」を参照してください。

TRANSFORM_SERVICE_PORT Studioからのリクエストを変換サービスがリスニングするポート。
ENABLE_CLUSTERING_SERVICE Oracleサポートのみで使用。このプロパティは、FALSEに設定したままにしてください。
CLUSTERING_SERVICE_SERVERS Oracleサポートのみで使用。このプロパティは変更しないでください。
CLUSTERING_SERVICE_PORT Oracleサポートのみで使用。このプロパティは変更しないでください。
WORKFLOW_MANAGER_SERVERS ワークフロー・マネージャ・サービス・ノード。1つのみ定義できます。
WORKFLOW_MANAGER_PORT ワークフロー・マネージャ・サービスがデータ処理リクエストをリスニングするポート。