主コンテンツへ
Oracle® Big Data SQLインストレーション・ガイド
リリース3 (3.1)
E83729-02
目次へ移動
目次
索引へ移動
索引

前
次

2 Hadoop側のOracle Big Data SQLのインストール

Oracle Big Data SQLはクラスタ管理サーバーによって提供されるサービスを使用してデプロイされます。インストーラ・プログラムでは管理サーバーAPIを使用してサービスを登録し、デプロイメント・タスクを開始します。そこから、管理サーバーがプロセスを制御し、クラスタのノードにソフトウェアをデプロイしてインストールします。

Big Data SQLをクラスタ管理サーバーにインストールしたら、バンドルに用意されているツールを使用して、データベース・サーバー側のインストール・パッケージを生成します。

リリース4.8以前のOracle Big Data Applianceのインストールに関する重要な注意事項:

  • Oracle Big Data SQL 3.1は、リリース4.8以前のOracle Big Data Applianceシステム上のbdacliユーティリティには組み込まれていません。これらのシステムでは、次のbdacliコマンドは、Oracle Big Data Appliance 4.7以前のリリース3.1では使用できません。

    bdacli {enable|disable} big_data_sql
    bdacli getinfo cluster_big_data_sql_enabled
    bdacli {start | stop | restart | status}  {big_data_sql_cluster | big_data_sql_server node_name}
  • 前述のbdacliコマンドは、サポートされているOracle Big Data Applianceリリースにインストールされている旧版のOracle Big Data SQLでは機能します

サポートされるすべてのHadoopシステム(My Oracle SupportOracle Big Data SQL Master Compatibility Matrix (ドキュメントID 2119369.1)に記載)では、このガイドで説明しているようにsetup-bdsスクリプトを使用してHadoopクラスタ上でOracle Big Data SQL 3.1をインストール、拡張、再構成、およびアンインストールできます。また、クラスタ管理サーバー・インタフェースを使用してOracle Big Data SQLプロセスを起動または停止することもできます。

Oracle Big Data Appliance 4.8以上では、bdacliとのOracle Big Data SQLの統合がリストアされたため、bdacliを使用してOracle Big Data SQLをインストールおよびアンインストール(有効化および無効化)するオプションもあります。Oracle Big Data SQLを管理するためのその他すべてのbdacliコマンドへもアクセスできます。

関連項目:

『Oracle Big Data Applianceオーナーズ・ガイド』のolink:BIGOG-GUID-685D1923-EC2A-42B6-8D97-1DFB8239D57C。

2.1 インストールの前提条件

次のアクティブなサービス、インストール済のパッケージおよび使用可能なシステム・ツールは、Oracle Big Data SQLインストールの前提条件です。

サポートされているLinuxディストリビューションおよびバージョンなどのプラットフォーム要件の他、サポートされているOracle Databaseのリリースおよび必要なパッチはここでは示しません。そのような情報は、My Oracle Supportの『Oracle Big Data SQL Master Compatibility Matrix』(ドキュメントID 2119369.1)を参照してください。

稼働サービス

次のApache Hadoopサービスは、クラスタ上で稼働している必要があります。

  • HDFS

  • YARN

  • Hive

実行時にはHBaseサービスが必要です。ただし、HBaseサービスはHadoopクラスタ上にOracle Big Data SQLのインストールをする場合の前提条件ではありません。Hadoop側のインストール中にHBaseがクラスタ上に存在する場合は、インストーラによってHBaseサーバーのバージョン・データが自動検出および保存されます。その後、次の手順でOracle Databaseノード上にインストールされるパッケージを作成する際、パッケージ・ビルダーによってインストール・パッケージ内に互換性のあるHBaseクライアントのダウンロード・サイトへのURLが自動的に含まれるようになります。データベース側のインストール・スクリプトをデータベース・サーバーにコピーして実行すると、データベース側のインストール・バンドルで提供されるURLからHBaseクライアントが(HadoopおよびHiveクライアントとともに)ダウンロードされます。Oracle Big Data SQLインストールのHadoop側を実行する際にHBaseサービスが存在しない場合は、次のように追加の手順があります。

Hadoop上のHBaseサーバーのバージョンと、HadoopにアクセスするOracle Databaseノード上のHBaseクライアントのバージョンが一致している必要があります。

正しいHDFSおよびHiveクライアントのURLがデータベースのインストール・バンドルで指定されていることを確認するための追加の手順は必要ありません。

重要:

前述のApache Hadoopサービスは、Cloudera CDHではパーセルとして、Hortonworks HDPではスタックとしてインストールする必要があります。RPMによるこれらのサービスのインストールは、いずれの場合にもサポートされません。

パッケージ

Oracle Big Data SQLをインストールする前に、すべてのHadoopクラスタ・ノード上に次のパッケージをインストールしておく必要があります。Java JDKは、Oracle Technology Networkでダウンロードできます。yumユーティリティは、次のパッケージをインストールする場合の推奨方法です。

  • Oracle JDKバージョン1.7以上

  • dmidecode

  • net-snmp、net-snmp-utils

  • perl

    PERL LibXML – 1.7.0以上(perl-XML-LibXML-1.70-5.el6.x86_64.rpmなど)

    perl-libwww-perl、perl-libxml-perl、perl-Time-HiRes、perl-libs

システム・ツール

  • curl

  • gcc

  • libaio

  • rpm

  • scp

  • tar

  • unzip

  • wget

  • yum

  • zip

libaioライブラリを各Hadoopクラスタ・ノード上にインストールする必要があります。
yum install -y libaio gcc 

環境設定

インストール前に次のように環境を設定する必要があります。

  • NTP有効

  • /usr/java/defaultが存在し、適切なJavaのバージョンにリンクされていることを確認します($JAVA_HOMEが存在しない場合)。

  • Javaバイナリのパスを/usr/java/latestに指定する必要があります

  • インストール・プロセスでは、ClouderaまたはHortonworksサイトからいくつかのパッケージをダウンロードするためにインターネットへのアクセスが必要です。このアクセスにプロキシが必要な場合は、次のLinux環境変数が正しく設定されていることを確認してください。

    • http_proxyおよびhttps_proxy

    • no_proxy

      no_proxyに次が含まれるように設定: "localhost,127.0.0.1,<Comma—separated list of the hostnames in the cluster (in FQDN format).>"。

  • インストールを実行する前に、Cloudera CDH上で、Cloudera Manager管理のすべてのプロキシ設定をクリアします。データベース側のインストール・バンドルを作成するスクリプト(bds-database-create-bundle.sh)を実行した後でそれらをリストアできます。

Python 2.7 (Oracle Big Data SQLインストーラ用)

Oracle Big Data SQLインストーラには、インストーラを実行するノード上にローカルでPython 2.7が存在する必要があります。これは、クラスタ管理サービス(CMまたはAmbari)が稼働する同じノードである必要があります。

いずれかのPython 2.7.xのバージョンがすでにインストールされている場合は、それを使用してOracle Big Dataインストーラを実行できます。

Python 2.7.0より前のバージョンがクラスタ管理サーバー上にすでにインストールされていて、この既存のインストールを上書きしないようにする必要がある場合は、2つ目のインストールとしてPython 2.7.xを追加できます。

制限:

Oracle Big Data Appliance上では、インストール済のPythonリリースを上書きまたは更新しないでください。この制限は、サポートされている他のHadoopプラットフォームにも適用される場合があります。ご使用のCDHまたはHDPプラットフォームに関するドキュメントを参照してください。

Oracle Linux 5では、Python 2.7を2つ目のインストールとして追加します。Oracle Linux 6では、Python 2.6と2.7の両方がインストールされていますが、インストーラには提供されているPython 2.7を使用してください。デフォルトのインタプリタがPython 2.6か2.7のいずれであるかを確認してください。Oracle Big Data SQLインストーラを実行するには、Python 2.7を明示的に起動する必要がある場合があります。Oracle Big Data Applianceでは、SCLがインストールされており、これを使用してこの例で示すようにシェルに対してバージョン2.7を有効化できます。

# scl enable python27 "./setup-bds install bds-config.json"

次は、2つ目のインストールとしてPython 2.7.5を追加するための手順です。

ヒント:

Pythonを手動でインストールする場合は、まずopenssl-develパッケージがインストールされていることを確認してください。

# yum install -y openssl-devel

2つ目のPythonのインストールを作成する場合は、Python更新を定期的に適用して新しいセキュリティ修正を組み込むことをお薦めします。オラクル社で直接指示される場合を除き、mammothインストールされたPythonは更新しないでください。

# pyversion=2.7.5
# cd /tmp/
# mkdir py_install
# cd py_install
# wget https://www.python.org/static/files/pubkeys.txt
# gpg --import pubkeys.txt
# wget https://www.python.org/ftp/python/$pyversion/Python-$pyversion.tgz.asc
# wget https://www.python.org/ftp/python/$pyversion/Python-$pyversion.tgz
# gpg --verify Python-$pyversion.tgz.asc Python-$pyversion.tgz
# tar xfzv Python-$pyversion.tgz
# cd Python-$pyversion
# ./configure --prefix=/usr/local/python/2.7
# make
# mkdir -p /usr/local/python/2.7
# make install
# export PATH=/usr/local/python/2.7/bin:$PATH

Oracle Big Data SQLがすでにインストールされている場合

Oracle Big Data SQLがすでにインストールされている場合、続行する前に、「Oracle Big Data SQLの旧リリースからのアップグレード」を一読してください。

重要:

Oracle Big Data SQL 3.0.1以前がHadoopクラスタですでに有効になっている場合、リリース3.1をインストールする前に、無効にするまたは削除する必要があります。

Oracle Big Data Appliance上のリリース3.0.1以前の場合は、bdacli disable big_data_sqlを実行します。これによってクラスタのすべてのノード上のOracle Big Data SQLが無効になります。

他のHadoopプラットフォーム(HDPまたはOracle以外のCDHベースのシステム)上でのアンインストールは、Oracle Big Data SQL 3.0.1と3.0で異なります。

  • リリース3.0.1の場合は、./setup-bds --uninstall bds-config.jsonにあるように、--uninstallパラメータを指定して元のインストールからsetup-bdsを実行します。

  • リリース3.0の場合は、プログラムによるアンインストールはありません。リリース3.0のアンインストールの手動による手順は、『Oracle Big Data SQL 3.0ユーザーズ・ガイド』を参照してください。

    リリース3.0より前のOracle Big Data SQLは、Oracle Big Data Appliance以外のシステムではサポートされません。

2.1.1 Hadoop DataNodeでの前提条件の確認

次のようにして、クラスタのDataNodeでOracle Big Data SQLインストールの前提条件を確認できます。

rootとして、次のチェックを各DataNodeで実行します。
# yum -y install dmidecode
# yum -y install net-snmp net-snmp-utils
# yum -y install perl perl-libs
# yum -y install perl-Time-HiRes perl-libwww-perl
# yum -y install perl-libxml-perl perl-XML-LibXML perl-XML-SAX
# ls -l /usr/java

2.2 Hadoopクラスタ管理サーバーでのインストール

Oracle Big Data SQLインストールの最初の手順は、Hadoopクラスタ管理サーバーでインストーラを実行することです(Cloudera ManagerがCDHシステムで実行しているかAmbariがHDPシステムで実行している場合)。管理サーバーでのインストール後タスクとして、データベース・サーバーのインストール・バンドルを準備するスクリプトを実行します。

Hadoop側では、ソフトウェアをクラスタ管理サーバーにのみ手動でインストールします。インストーラでは、CDHまたはAmbariを使用してクラスタ構成を分析し、Oracle Big Data SQLを必要とするすべてのノードにOracle Big Data SQLを自動的にデプロイしてインストールします。

注意:

インストーラのセキュリティについて
  • AmbariおよびCloudera Managerのパスワードは、コマンドラインでは渡されず、インストール時またはインストールの完了後に(ログ・ファイル、トレース・ファイルを含む)永続ファイルに保存されることもありません。

  • 全ユーザーに書込み権限がある一時ファイルまたは永続ファイルは作成されません。

  • setuidファイルまたはsetgidファイルは使用されません。

  • インストーラは、Cloudera CDHおよびHortonworks HDPのセキュリティ・ドキュメントで説明されているように、堅牢なOracle Database環境の他、堅牢なCDHおよびHDPクラスタとも連携して機能します。

クラスタ管理サーバーで実行する3つのタスクを次にまとめます。詳細は、このまとめの後に示します。

次の場合は、一時的な回避策が必要となる可能性があります。

setup-bdsインストール・スクリプトではいくつかのHive補助パラメータが設定されますが、これによって既存のカスタム設定が上書きされることがあります。たとえば、インストールに関するHive操作のロギングを有効にするため、スクリプトでhive.server2.logging.operation.enabled=trueが設定されます。setup-bdsが完了した後(およびプロセスbds-database-create-bundle.shで次のスクリプトを実行する前に)、Hive補助パラメータ設定を確認し、必要に応じて上書きされた可能性があるものをリストアします。この回避策は、次のOracle Big Data SQLリリースでは必要なくなります。

Oracle Big Data SQLのアンインストール(同様にsetup-bdsを使用)では、アンインストールによってhive.server2.logging.operation.enabled parameterが完全に削除され、効率的にデフォルト値のtrueに設定されます。

  • BigDataSQL-<Hadoop_distribution>-<version>.zipアーカイブからファイルを抽出します。次に、bds-config.jsonを構成し、install引数を指定してsetup-bdsを実行します。これにより、Oracle Big Data SQLがクラスタ管理サーバーの他、クラスタ内のすべてのHadoop DataNodeにもインストールされます。

  • データベース・バンドル作成スクリプトbds-database-create-bundleを実行します。これにより、Oracle Big Data SQLをOracle DatabaseサーバーにインストールするためにOracle Databaseサーバーで実行するデータベース・バンドル・ファイルが生成されます。

  • データベース・バンドル・ファイルのパラメータを確認し、必要に応じて調整します。

データベース・バンドル・ファイルを確認して(必要な場合に)編集してから、Oracle Databaseサーバーにコピーし、「Oracle Databaseサーバーでのインストール」の説明に従って実行します

クラスタ管理サーバーでのOracle Big Data SQLのインストール

重要: 一部のシステムにはパッチ25796576が必要です。

ご使用のシステムが次の基準を満たす場合はこのパッチをインストールしてください。

  • Oracle Big Data Appliance以外のシステムの場合: CDHを使用し、Oracle Linux 6、Oracle Linux 7、およびRed Hat 6またはRed Hat 7上で実行している。

  • Oracle Big Data Applianceの場合: Oracle Big Data SQLがこのドキュメントで記述されているインストーラを使用してインストールされている(つまり、Mammothまたはbdacliユーティリティでインストールされていない)。

ご使用のシステムがこれらの基準を満たす場合は、次の手順でzipファイルをダウンロードする場所と同じノードおよびディレクトリにパッチ25796576をダウンロードします。パッチはzipファイルの解凍後にインストールしてください。

パッチのインストール手順およびパッチが必要となる状況の詳細は、My Oracle Supportにある次のドキュメントを参照してください。Big Data SQL 3.1と連携するOracle Big Data Appliance CDHクラスタOL6への個別パッチ25796576の適用(ドキュメントID 2269180.1)。これはOracle Linux 5には適用されません。

クラスタ管理サーバーにBig Data SQLをインストールする手順は次のとおりです。

  1. 適切なzipファイル(BigDataSQL-<Hadoop_distribution>-<version>.zip)をクラスタ管理サーバー(Cloudera ManagerまたはAmbariが稼働しているノード)の一時的な場所にコピーします。

  2. ファイルを解凍します。

    1. CDHシステムの場合は、この時点でパッチ25796576を実行し、Oracle Big Data SQLのインストールに進みます。

  3. ディレクトリをBDSSetupに変更します。

  4. 構成ファイルを編集します。

    この後の表2–4で、各構成パラメータの使用方法を説明します。

    • CDHの場合は、この例のようにbds-config.jsonを編集します。使用されていないポートはWebサーバー・ポートとして機能します。

      {
      "cluster": {
         "name": "cluster1",
         "display_name": "Cluster 1"
      },
      "database":{
         "ip": "10.11.12.13/14"
      },
      "memory": {
         "min_hard_limit": 8192
      },
      "webserver": {
         "port": 80
      }
      }
    • HDPの場合は、この例のようにbds-config.jsonを編集します。HDP構成ファイルにdisplay_nameパラメータまたはmin_hard_limitパラメータが含まれていないことに注意してください。

      {
      "cluster": {
         "name": "cluster1",
      },
      "database":{
         "ip": "10.11.12.13/14"
      },
      "webserver": {
         "port": 80
      }
      }

    DATABASE_IPは、インストールを実行するデータベース・ノードに対して正しいネットワーク・インタフェース・アドレスである必要があります。これは、データベース・ノードで/sbin/ip -o -f inet addr showを実行して確認できます。

    注意:

    次の手順では、クラスタ管理者のユーザーIDおよびパスワードが必要です。
  5. BDSSetupディレクトリで、rootとなってsetup-bdsを実行します。installパラメータおよび構成ファイル名(bds-config.json)を引数として渡します。クラスタ管理サービスは、このプロセスで再起動されることに注意してください。

    [root@myclusteradminserver:BDSSetup] # ./setup-bds install bds-config.json
    スクリプトにより、クラスタ管理サービス管理者資格証明の入力を求められた後、Oracle Big Data SQLが管理サーバーおよびクラスタ・ノードにインストールされます。インストールがエラーなしで完了すると、スクリプトの出力は次のメッセージで終了します。
    BigDataSQL: INSTALL workflow completed.

    関連項目:

    これは、簡略化された例です。正常終了したインストールからの完全な標準出力の例は、「Oracle Big Data SQLのインストール/アンインストール/再構成の例」を参照してください。

bds-config.jsonのパラメータ

次の表では、CDHおよびHDPプラットフォーム用にbds-config.jsonで実行する必要がある編集について説明します。

表2-1 bds-config.jsonの構成パラメータ

構成パラメータ 説明 適用対象 必須/オプション
cluster:{name} クラスタの名前。これらのパラメータの両方に適用される動作は、次のdisplay_nameに関する説明を参照してください。 CDH、HDP CDHの場合に必須。

HDPの場合はオプション。

cluster:{display_name}

display_nameは、Cloudera Manager内でターゲット・クラスタを検索するためのオプションの識別子です。必要とされるnameパラメータの代替として使用できます。Oracle Big Data SQLは、cluster:{name}を検証できない場合にフォールバックとしてそれを使用しようとします。

CDHのみ オプション
database:{ip}

接続リクエストを行うOracle DatabaseサーバーのIPアドレス。これは、データベース・ノード上の1つのインタフェースに対して構成する必要があります。アドレスには(100.112.10.36/24のように)接頭辞の長さを含める必要があります。構成ファイルでは1つのIPアドレスのみが指定されますが、インストール時にipをオーバライドするコマンドライン・パラメータを使用することによって、複数のデータベース・サーバーに(RAC環境内のように)データベース側のソフトウェアをインストールできます。(表3-1--ip-cellの説明を参照してください。)

CDH、HDP 必須
memory:{min_hard_limit}

Oracle Big Data SQLに必要な最小のメモリー量。

CDHのみ オプション
webserver:{port} タスクをデプロイし、インストール時にDataNodeからレスポンスを収集するために使用される一時リポジトリ用のポート。これは、現在のクラスタ操作と競合しなければ、どのポートでもかまいません。 CDH、HDP 必須
api:{port} このポートがデフォルト・ポートとは異なる場合、CDHまたはAmbariのREST API用のポート。 CDH、HDP オプション

setup-bdsによって実行される操作

次の表に、setup-bdsによって実行される全操作を示します。

すべてオプションの構文は次のとおりです。

# ./setup-bds <option> bds-config.json

次に例を示します。

# ./setup-bds install bds-config.json

表2-2 setup-bds.shのコマンドライン・オプション

setup-bdsのオプション 用途
install

クラスタ管理サーバーにOracle Big Data SQLソフトウェアをインストールします。

extend

前回のOracle Big data SQLインストール以降、クラスタが拡大している場合、Oracle Big Data SQLを新しいDataNodeまで拡張してセル・インベントリを更新します。

remove

DataNodeサービスが存在しなくなったノードからOracle Big Data SQLコンポーネントを削除します。

DataNodeサービスを移動または削除する場合は、これを実行する必要があります。必要となるシナリオには、クラスタのロード・バランシングを改善するために、DataNodeサービスが別のノードに移動されている場合が考えられます。

reconfigure

bds-config.jsonの構成に対して加えた変更を適用することで、現在のインストールを変更します。

setup-bds reconfigure bds-config.jsonを実行してHadoop側のOracle Big Data SQLを再構成する場合、対応する再構成がOracle Database側で必要です。構成が一致していない場合は両側で通信できません。その場合、データベース側のバンドル・ファイルを再構成して変更を組み入れた後、以前にインストールしたデータベース・サーバーすべてにバンドルを再デプロイする必要があります。

再構成の場合、変更を比較的速くデプロイできるように、軽量のデータベース・バンドルが提供されます。このバンドルには、初回インストールで必要なtarballが不要で、含まれていません。

uninstall Oracle Big Data SQLをHadoopクラスタ管理サーバーからアンインストールします。

2.3 データベース側のインストール・バンドルの作成

クラスタ管理サーバーにOracle Big Data SQLをインストールしたら、スクリプトBDSSetup/db/bds-database-create-bundle.shを実行します。このスクリプトにより、Hadoopシステム上のデータを問い合せるOracle Databaseサーバー用に対応するOracle Big Data SQLインストール・バンドルが作成されます。

bds-database-create-bundleは、インストール時の実行に加えて、データベース・サーバーと通信する必要があるクラスタ管理サーバーに次のような構成変更を行った場合にも実行する必要があります。

  • セキュアでないHTTPからセキュアなHTTPへなどのクラスタ構成の変更。

  • ノード間のHiveメタストアの移行。

  • クラスタ管理サーバーでのCMまたはAmbariポートの変更。

  • データベース側のインストールに使用されるIPアドレスの変更。

データベース側のバンドルに必要な外部リソース

bds-database-create-bundleでは、次の外部リソースをダウンロードしようとします。

  • ClouderaまたはHortonworksリポジトリWebサイトからのHadoopおよびHiveクライアントtarball。

  • Cloudera Manager (CDHバージョン用)またはAmbari (HDPバージョン用)を介した、クラスタ管理サーバーからのYarnおよびHiveの構成ファイル。

  • HDPのみ、AmbariからのHDFSおよびMapReduce構成ファイル。

このようなリソースの一部に管理サーバーからアクセスできない場合、それらを手動で追加できます。表2-3で説明されているコマンドライン・スイッチを使用し、選択したリソースのダウンロードを手動でオフにしてそれらのリソースがバンドルに追加されないようにすることもできます。

bds-database-create-bundleの実行

このスクリプトは、rootとして実行します。クラスタ管理サービス管理者資格証明の入力を要求されることに注意してください。

  1. ディレクトリをBDSSetup/dbに変更します。

  2. BDSデータベース・バンドル作成スクリプトを実行します。デフォルト設定をオーバーライドするためにスクリプトに渡すことができるオプションのパラメータについては、次の表2-3を参照してください。

    [root@myclusteradminserver: db] # ./bds-database-create-bundle.sh <optional parameters> 
    

    操作が成功すると、次のメッセージが返されます。

          bds-database-create-bundle: database bundle creation script completed all steps

bds-database-create-bundleスクリプトにより、2つの異なるデータベース・バンドルがBDSSetupディレクトリ内(BDSSetup/dbディレクトリ内ではない)に生成されます。

  • bds-database-install.zip

    このバンドルは、Oracle Big Data SQLの初回インストールのために(または、他の理由で完全再インストールが必要な場合に)データベース・サーバーにデプロイします。ClouderaまたはHortonworksからダウンロードしたリソース(tarballおよび構成ファイル)を含め、ソフトウェアのインストールに必要なファイルがすべて含まれています。

  • bds-database-install-config.zip

    このバンドルは、クラスタ管理サーバーの既存のOracle Big Data SQL構成を変更する場合に、bds-database-install.zipのかわりにデータベース・サーバーにデプロイします。このパッケージにより、対応する変更がデータベース側の構成に加えられ、両側(HadoopとOracle Database)が合致します。Oracle Big Data SQLの再構成には、完全インストールで必要な外部リソース(クライアントtarballなど)が不要です。したがって、このバンドルは、完全インストールのバンドルより小さく、速くデプロイできます。

データベース・バンドル・ファイルには複数のパラメータが含まれています。bds-database-create-bundle.shを実行する際、これらのパラメータをオーバーライドするために必要に応じて次の表のスイッチを使用できます。指定されるURLは、bds-database-create-bundle.shの実行時にクラスタ管理サーバーからアクセスできる必要があります。

表2-3 bds-database-create-bundle.shのコマンドライン・スイッチ

パラメータ
--hadoop-client-ws Hadoopクライアントtarballダウンロード用のURLを指定します。
--no-hadoop-client-ws このダウンロードを除外します。
--hive-client-ws Hiveクライアントtarballダウンロード用のURLを指定します。
--no-hive-client-ws このダウンロードを除外します。
--yarn-conf-ws YARN構成zipファイルをダウンロードするためのURLを指定します。
--no-yarn-conf-ws このダウンロードを除外します。
--hive-conf-ws Hive構成zipファイルをダウンロードするためのURLを指定します。
--no-hive-conf-ws このダウンロードを除外します。
--ignore-missing-files 一部のファイルがない場合にもバンドル・ファイルを作成します。
--jdk-tar-path デフォルトのJDKパスをオーバライドします。相対パスを指定せず、--jdk-tar-path=<jdk tarfile absolute path>を使用します。
--clean-previous 以前のバンドル・ファイルとディレクトリをbds-database-install/から削除します クラスタ管理サーバーのクラスタ設定が変更された場合(たとえば、拡張、サービス・ノードの移行、セキュリティの追加または削除など)、データベース・サーバーでインストールを再実行する必要があります。この再インストールの一環として、--clean-previousを実行し、前のインストールからデータベース・サーバー側に残されたクラスタ情報をパージする必要があります。
--script-only これは、データベース・サーバーに伝えるクラスタ構成の変更がなく、データベース側でファイル(クライアントtarballなど)をリフレッシュする必要がない場合に、データベース側での再インストールに便利です。このスイッチでは、bds-database-create-bundle.shは、データベース・インストール・スクリプトのみを含み、tarballなどの他のコンポーネントはバンドルしないzipファイルを生成します。これらがすでにデータベース・サーバーに存在する場合には、--script-onlyを使用してこれらの大きいファイルのダウンロードおよびパッケージングを省略できます。この場合、--clean-previousを含めないでください。
--hbase-client-ws このパラメータは、HBaseがHadoopクラスタにインストールされていない場合のみ、必須です。HBaseのtarballをClouderaまたはAmbariのWebサイトからダウンロードできるURLを指定します。このURLは、使用しているCDHまたはHDPインストールによってサポートされている特定のバージョンのHBaseを指す必要があります。

HBaseがインストールされていない場合は、bds-database-create-bundle.shを実行する際に、このパラメータを挿入します。 

$ bds-database-create-bundle.sh --hbase-client-ws <URL>

HBaseがインストールされていない場合に、このパラメータをbds-database-create-bundle.shの実行時に指定しないと、URLの入力を求められます。

--hdfs-conf-ws HDFS構成zipファイルをダウンロードするためのURLを指定します。
--no-hdfs-conf-ws このダウンロードを除外します(HDPのみ)。
--mapreduce-conf-ws MapReduce構成zipファイルをダウンロードするためのURLを指定します(HDPのみ)。
--no-mapreduce-conf-ws このダウンロードを除外します(HDPのみ)。
--reconfigure 既存のファイルでバンドルを作成しますが、新しい構成のダウンロードを強制します。

リソースの手動追加(ダウンロード・サイトがBDSデータベース・バンドル作成スクリプトにアクセスできない場合)

デフォルトのダウンロード・サイトの1つ以上がクラスタ管理サーバーからアクセスできない場合、この問題を回避する方法が2つあります。

  • 先に別のサーバーからファイルをダウンロードしてから、代替パスで引数としてbds-database-create-bundle.shを指定します。次に例を示します。

    $ ./bds-database-create-bundle.sh --yarn-conf-ws='http://nodexample:1234/config/yarn'
  • スクリプトが最初にローカルの/bds-database-installでリソースを検索するため、ファイルを別のサーバーにダウンロードしてから、クラスタ管理サーバー上の/bds-database-installに移動して、追加の引数なしでバンドル作成スクリプトを実行できます。次に例を示します。

    $ cp hadoop-xxxx.tar.gz bds-database-install/
    $ cp hive-xxxx.tar.gz bds-database-install/
    $ cp yarn-conf.zip bds-database-install/
    $ cp hive-conf.zip bds-database-install/
    $ cd db
    $ ./bds-database-create-bundle.sh

Oracle Databaseサーバーへのデータ・バンドルのコピー

scpを使用して、作成したデータベース・バンドルをOracle Databaseサーバーにコピーできます。次の例では、dbnodeがデータベース・サーバーです。ここでのLinuxアカウントおよびターゲット・ディレクトリは任意です。指定されたパスにscpする権限のある任意のアカウントを使用します。

現在のリリースのOracle Big Data SQLを初めてインストールする場合は、bds-database-install.zip (完全インストール・バンドル)を各データベース・ノードにコピーします。

$ scp bds-database-install.zip oracle@dbnode:/home/oracle

データベース・サーバーで既存のOracle Big Data SQLインストールの構成を更新する場合は、bds-database-install.zipのかわりに、より小さい構成更新バンドル(bds-database-install-config.zip)をデータベース・ノードにコピーします。

$ scp bds-database-install-config.zip oracle@dbnode:/home/oracle

次の手順では、Oracle Databaseサーバーにログオンしてバンドルをインストールします。