bdd.confの最初の部分には必須の設定が含まれます。システムに固有の情報で、これらのプロパティを更新する必要があり、これを行わないとインストーラは失敗する場合があります。
この項では、値を指定する必要がある空白の設定について説明します。これらを設定しないと、インストールは失敗します。
構成プロパティ | 説明 |
---|---|
ORACLE_HOME | クラスタ内の各ノードでBDDがインストールされる、BDDルート・ディレクトリへのパス。このディレクトリは存在していない必要があります。インストーラがそれを作成できるようにするには、親ディレクトリの権限に755または775を設定し、各BDDノードで少なくとも30GBの領域が使用可能である必要があります。
これは、Studioデータベースで必要なORACLE_HOME環境変数とは異なります。 |
ORACLE_INV_PTR | インストーラによって作成される、Oracleインベントリ・ポインタへの絶対パス。このファイルはORACLE_HOMEディレクトリに配置できません。
他のOracleソフトウェア製品がインストールされている場合、このファイルはすでに存在します。それを指すようにこのプロパティを更新します。 |
INSTALLER_PATH | オプションです。インストール・ソース・ディレクトリの絶対パス。これは、10GB以上の空き領域を含んでいる必要があります。
このプロパティを設定しない場合は、INSTALLER_PATH環境変数を設定するか、実行時にパスを指定できます。詳細は、「インストールの概要」を参照してください。 |
DGRAPH_INDEX_DIR | Dgraphデータベースへの絶対パス。このディレクトリは、ORACLE_HOMEの下には配置できず、配置した場合削除されます。
このディレクトリが現在存在しない場合、スクリプトによって作成されます。既存データベースとともにインストールしている場合は、このプロパティをそれらの親ディレクトリに設定します。 HDFS保存データ暗号化をHadoopで有効にし、データベースをHDFSに格納する場合は、暗号化ゾーン内であることを確認してください。 |
HADOOP_UI_HOST | Hadoopマネージャ(Cloudera Manager、AmbariまたはMCS)をホストするサーバーの名前。 |
STUDIO_JDBC_URL | StudioデータベースのJDBC URL。
このプロパティには3つのテンプレートがあります。データベース・タイプに対応するテンプレートをSTUDIO_JDBC_URLにコピーし、データベースを指すようにURLを更新します。
複数のマシンにインストールしている場合は、localhostではなくデータベース・ホストのFQDNを使用してください。 |
WORKFLOW_MANAGER_JDBC_URL | ワークフロー・マネージャ・サービス・データベースのJDBC URL。
このプロパティには2つのテンプレートがあります。データベース・タイプに対応するテンプレートをWORKFLOW_MANAGER_JDBC_URLにコピーし、データベースを指すようにURLを更新します。
複数のマシンにインストールしている場合は、localhostではなくデータベース・ホストのFQDNを使用してください。 |
この項では、すべてのコンポーネントおよびインストール・プロセス自体に関連する設定を構成します。
構成プロパティ | 説明 |
---|---|
INSTALL_TYPE | ハードウェアおよびHadoopディストリビューションに従って、インストール・タイプを決定します。これには、次のいずれかを設定します。
このドキュメントは、Oracle Big Data Appliance (BDA)またはOracle Public Cloud (OPC)のインストールを対象としていません。Big Data Applianceにインストールする場合、『Oracle Big Data Applianceオーナーズ・ガイド リリース4 (4.6)』および対応するMOS注記を参照してください。 |
JAVA_HOME | JDKインストール・ディレクトリの絶対パス。これは、すべてのBDDサーバーで同じである必要があり、$JAVA_HOME環境変数と同じ値を持っている必要があります。
複数のバージョンのJDKがインストールされている場合、正しいものを指していることを確認してください。 |
TEMP_FOLDER_PATH | インストール中に各ノードで使用される一時ディレクトリ。このディレクトリはすべてのBDDノードに存在している必要があり、20GB以上の空き領域を含んでいる必要があります。 |
この項では、Hadoopに関連するプロパティについて説明します。インストーラは、これらのプロパティを使用して、ホスト・サーバーのURIおよび名前など、Hadoopコンポーネントに関する情報をHadoopクラスタ・マネージャ(Cloudera Manager、AmbariまたはMCS)に問い合せます。
構成プロパティ | 説明および可能な設定 |
---|---|
HADOOP_UI_PORT | Hadoopクラスタ・マネージャを実行するサーバーのポート番号。 |
HADOOP_UI_CLUSTER_NAME | クラスタ・マネージャにリストされるHadoopクラスタの名前。クラスタ名内の空白は%20に置き換えます。 |
HUE_URI | HDPのみ。Hueが実行されているノードのホスト名およびポート。形式は<hostname>:<port>です。 |
HADOOP_CLIENT_LIB_PATHS | Hadoopクライアント・ライブラリへの絶対パスのカンマ区切りリスト。
注意: HDPまたはMapRがある場合、インストールする前に、このプロパティの設定のみを行う必要があります。CDHの場合、インストーラにより、必要なライブラリがダウンロードされ、このプロパティが自動的に設定されます。これには、インターネット接続が必要であることに注意してください。スクリプトが、ライブラリをダウンロードできない場合、この問題を解決するための手順については「Hadoopクライアント・ライブラリのダウンロードの失敗」を参照してください。
このプロパティを設定するには、HadoopディストリビューションのテンプレートをHADOOP_CLIENT_LIB_PATHSにコピーし、インストール・マシンにコピーしたクライアント・ライブラリを指すようにパスを更新します。<UNZIPPED_XXX_BASE>を正しいライブラリへの絶対パスにすべて置き換えます。 パスは表示されるとおりに指定する必要があるため、リスト内のパスの順序は変更しないでください。 |
HADOOP_CERTIFICATES_PATH | TLS/SSLが有効になっているHadoopクラスタにのみ必要です。HDFS、YARN、HiveおよびKMSの証明書を配置したインストール・マシン上のディレクトリへの絶対パス。
このディレクトリは証明書を更新する必要がある場合に使用するため、インストール後に削除しないでください。 |
この項では、BDDのKerberosを構成します。これらのプロパティは、Kerberosを有効にする場合にのみ変更します。
構成プロパティ | 説明および可能な設定 |
---|---|
ENABLE_KERBEROS | BDDクラスタでKerberosを有効にします。クラスタにKerberosがインストールされていて、これにBDDを統合する場合は、この値をTRUEに設定します。そうでない場合は、FALSEに設定します。 |
KERBEROS_PRINCIPAL | BDDプリンシパルの名前。これには、ドメインの名前を含める必要があります。例: bdd-service@EXAMPLE.COM。
このプロパティが必要になるのは、ENABLE_KERBEROSがTRUEに設定されている場合のみです。 |
KERBEROS_KEYTAB_PATH | インストール・マシンのBDD keytabファイルへの絶対パス。
インストーラは、これをbdd.keytabに名前変更し、すべてのBDDノードの$BDD_HOME/common/kerberos/にコピーします。 このプロパティが必要になるのは、ENABLE_KERBEROSがTRUEに設定されている場合のみです。 |
KRB5_CONF_PATH | インストール・マシン上のkrb5.confファイルへの絶対パス。インストーラは、これをすべてのBDDノードの/etcにコピーします。
このプロパティが必要になるのは、ENABLE_KERBEROSがTRUEに設定されている場合のみです。 |
このセクションでは、管理サーバーおよびすべての管理対象サーバーを含む、WebLogic Serverを構成します。
構成プロパティ | 説明および可能な設定 |
---|---|
ADMIN_SERVER | 管理サーバーになるインストール・マシンのホスト名。
これを空白にした場合、現在のマシンのホスト名がデフォルトとして設定されます。 |
MANAGED_SERVERS | 管理対象サーバー・ホスト名(WebLogic、StudioおよびDgraph Gatewayを実行するサーバー)のカンマ区切りのリスト。このリストには管理サーバーが含まれる必要があり、重複する値を含めることはできません。
複数の管理対象サーバーを定義する場合は、インストール後に、それらの前にロード・バランサを設定する必要があります。詳細は、「Studioのロード・バランシングの構成」を参照してください。 |
このセクションでは、DgraphおよびHDFSエージェントを構成します。
構成プロパティ | 説明および可能な設定 |
---|---|
DGRAPH_SERVERS | DgraphおよびDgraph HDFSエージェントを実行するノードのホスト名のカンマ区切りのリスト。
このリストには重複する値を含めることはできません。データベースをHDFSに格納する予定の場合、これらはHDFS DataNodesである必要があります。最善のパフォーマンスのために、これらのノード上で実行されるその他のHadoopサービス(特にSpark)にはしないでください。 |
DGRAPH_THREADS | Dgraphの起動に使用されるスレッドの数。これは、2以上にする必要があります。正確な数は、マシン上で実行されるその他のサービスによって異なります。
このプロパティを空白にした場合、CPUコア数から2を引いた数がデフォルトとして設定されます。 使用する数は必ずライセンス契約に従います。 |
DGRAPH_CACHE | Dgraphキャッシュのサイズ(MB)。数値のみを指定し、MBは含めないでください。
このプロパティを空白にした場合、ノードの使用可能なRAMの50%または空きメモリー量の合計から2GBを引いた値(いずれか大きい方)がデフォルトとして設定されます。 ノードの使用可能なRAMの少なくとも50%をDgraphキャッシュに割り当てることをお薦めします。後から、処理に使用できるメモリーが十分でないために問合せが取り消されていることがわかった場合は、この量を徐々に減らしてください。 |
ZOOKEEPER_INDEX | ZooKeeperによって識別に使用されるZooKeeperアンサンブル内のDgraphクラスタの索引。 |
このセクションでは、データ処理およびHive表ディテクタを構成します。
構成プロパティ | 説明および可能な設定 |
---|---|
HDFS_DP_USER_DIR | Studioユーザーがデータをエクスポートすると作成されるサンプル・ファイルを格納するHDFS /userディレクトリ内の場所。このディレクトリの名前に空白およびスラッシュ(/)を含めることはできません。それがまだ存在しない場合、インストーラによって作成されます。
MapRがあり、既存のディレクトリを使用する場合は、それをボリュームでマウントする必要があります。 |
YARN_QUEUE | データ処理ジョブの送信先のYARNキュー。 |
HIVE_DATABASE_NAME | Studioデータ・セットのソース・データを格納するHiveデータベースの名前。
デフォルト値は、defaultです。これは、Hive表ディテクタで使用されるDETECTOR_HIVE_DATABASEのデフォルト値と同じです。これらのプロパティに異なるデータベースを使用することはできますが、初回インストールのもので始めることをお薦めします。 |
SPARK_ON_YARN_JAR | Hadoopノード上のSpark on YARN JARへの絶対パス。これは、CLIクラスパスに追加されます。
このプロパティには2つのテンプレートがあります。Hadoopディストリビューションに対応するテンプレートの値をSPARK_ON_YARN_JARにコピーして、次のようにその値を更新します。
このJARは、すべてのHadoopノード上で同じ場所にある必要があります。 |
このセクションでは、変換サービスを構成します。
構成プロパティ | 説明および可能な設定 |
---|---|
TRANSFORM_SERVICE_SERVERS | 変換サービス・ノードのカンマ区切りのリスト。
最善のパフォーマンスのためには、これらはすべて管理対象サーバーである必要があります。特に、Dgraphノードにはしないでください。これは、Dgraphにも変換サービスにも大量のメモリーが必要となるためです。 複数の変換サービス・ノードを定義する場合は、インストール後に、それらの前にロード・バランサを設定する必要があります。手順については、「変換サービスのロード・バランシングの構成」を参照してください。 |
TRANSFORM_SERVICE_PORT | Studioからのリクエストを変換サービスがリスニングするポート。 |
ENABLE_CLUSTERING_SERVICE | Oracleサポートのみで使用。このプロパティは、FALSEに設定したままにしてください。 |
CLUSTERING_SERVICE_SERVERS | Oracleサポートのみで使用。このプロパティは変更しないでください。 |
CLUSTERING_SERVICE_PORT | Oracleサポートのみで使用。このプロパティは変更しないでください。 |
WORKFLOW_MANAGER_SERVERS | ワークフロー・マネージャ・サービス・ノード。1つのみ定義できます。 |
WORKFLOW_MANAGER_PORT | ワークフロー・マネージャ・サービスがデータ処理リクエストをリスニングするポート。 |