Oracle Big Data SQL 3.1は、Oracle Big Data Appliance、またはCDH (Cloudera's Distribution including Apache Hadoop)、HDP (Hortonworks Data Platform)に基づく他のHadoopシステムにおいて、Oracle DatabaseをHadoop環境に接続することができます。
旧リリースのBig Data SQLでは、HadoopサーバーとOracle Databaseサーバーの様々な組合せにおけるインストールには、いくつかの相違がありました。現在のリリースでは、サポートされているすべてのHadoopシステムおよびOracle Databaseシステムに対して共通のインストール・プロセスがあります。
注意:
Oracle Big Data SQL 3.0.1は旧リリースであり、Oracle Big Data Appliance 4.7インストール・バンドルに含まれています。Oracle Big Data Appliance 4.3以上のMammothインストールでまたはインストール後に、Oracle Big Data SQL 3.0.1を有効にすることができます。Oracle Big Data SQL 3.0.1をインストールすることにした場合は、このバージョンのガイドの手順を使用しないでください。その場合は、リリース3.0.1用の『Oracle Big Data SQLユーザーズ・ガイド』のOracle Big Data ApplianceおよびOracle Exadata Database Machineでのインストールに関する項を参照してください。次のものとのBig Data SQLの互換性についての最新情報は、My Oracle Supportの『Oracle Big Data SQL Master Compatibility Matrix』(Doc ID 2119369.1)を参照してください。
Oracle Engineered Systems。
その他のシステム。
Linux OSのディストリビューションとバージョン。
Hadoopディストリビューション。
必要とされるパッチを含むOracle Databaseのリリース。
Oracle Big Data SQLソフトウェアは、すべてのHadoopクラスタ・ノードおよびすべてのOracle Databaseコンピュート・ノードにインストールする必要があります。
重要: サービスの再起動について
Hadoop側のインストールでは、次のように再起動が行われる可能性があります。
Cloudera Configuration Manager (またはAmbari)が再起動される可能性があります。これ自体では、どのサービスも中断されません。
Hive、YARN、およびHiveまたはYARN上で依存関係を持つその他のサービス(Impalaなど)は再起動されます。
Oracle Big Data SQL JARを含めるため、Hiveのlibrariesパラメータが更新されます。ClouderaインストールでYARN Resource Managerが有効な場合は、Oracle Big Data SQLおよび他のHadoopサービスのcgroupメモリー制限を設定するために再起動されます。Oracle Big Data Applianceでは、YARN Resource Managerは常に有効であるため、常に再起動されます。
注意:
Oracle Big Data SQLインストール・スクリプトでは、このメッセージが出力に含まれます。BigDataSQL: Restarting cluster...
再起動はクラスタの「失効している」コンポーネントに制限され、Hive、YARN、およびそれらと依存関係を持つサービスが対象になります。
Oracle Database serverの場合、Gridノードのセル設定に更新が必要な環境では、インストールでデータベースまたはOracle Gridインフラストラクチャ(あるいはその両方)を再起動する必要があることがあります。詳細は、「グリッド・インフラストラクチャの再起動要件の可能性」を参照してください。
所要時間
Hadoopクラスタへのインストールには、約30分かかります。データベース側のインストール・バンドルの生成には、ダウンロードしたHadoopおよびHiveのクライアントなどのソフトウェアが必要です。インターネットのダウンロード速度に応じて、これにはさらに20分かかります。データベース側の平均のインストール時間は次のように予測できます。
再起動が不要な場合は、1つのノード・データベースにつき15分間。再起動が必要な場合は、時間はデータベースのサイズにより異なります。
RACデータベースでは、前述の時間をノードの数でかけたものになります。
Oracle Gridの再起動が必要な場合は、その時間も考慮に入れます。
インストール手順の概要
Oracle Big Data SQLのインストールに関するタスクの順序を次に示します。
作業を開始する前に、次のようにします。
『Oracle Big Data SQL Master Compatibility Matrix』 (My Oracle Supportのドキュメント2119369.1)で一般的なプラットフォームの互換性を確認します。
このガイドの「インストールの前提条件」で必要なソフトウェアを確認します。
必要となるログイン資格証明は、次のとおりです。
Hadoopクラスタと、すべてのOracle Gridノードの両方のroot
資格証明。
グリッド・ノードでは、かわりにrootユーザーとともにパスワードなしSSHを使用するオプションもあります。
oracle
Linuxユーザー(または、データベース所有者がoracle
でない場合はその他)
Oracle Gridユーザー(データベースの所有者と同じでない場合)。
Hadoop構成管理サービス(CMまたはAmabari)の管理パスワード。
クラスタ管理サーバー(CMまたはAmbariが稼働している)で、Oracleからソフトウェアをダウンロードします。(「Oracle Big Data SQLのダウンロード」を参照してください。)
クラスタ管理サーバーで、「インストールの前提条件」の説明に従って、Python 2.7がインストールされていることを確認します。
「Hadoop側のOracle Big Data SQLのインストール」で説明されているHadoop側のインストールを実行します。
インストールのHadoop側のフェーズで、次を実行します。
Oracle Big Data SQLバイナリをクラスタとともにデプロイします。
各クラスタ・ノードのサービスについてLinuxとネットワークの設定を構成します。
クラスタ管理サーバーでBDSサービスを構成します。
クラスタへのOracle Database接続を構成するために必要な情報を取得します。
Hadoopクラスタ管理サーバーで、Oracle Database側にOracle Big Data SQLをインストールするバンドルを作成するスクリプトを実行します。(「データベース側のインストール・バンドルの作成」を参照してください。)
Oracle Databaseサーバー側のインストールを実行します。(「Oracle Database側のOracle Big Data SQLのインストール」を参照してください。)
インストールのこのフェーズで、生成したデータベース側のインストール・バンドルをデータベース・ノードにデプロイします。zipファイルから抽出して実行します。
データベース側のインストーラでは、次の処理を実行します。
Oracle Big Data SQLバイナリをデータベース・ノードにコピーします。
サービスのネットワーク設定を構成します。
クラスタ・メタデータをOracle Databaseに挿入します。
重要:
必ず各コンピュート・ノードにバンドルをインストールします。Hadoop側のインストールでは、Oracle Big Data SQLソフトウェアがHadoopクラスタの各DataNodeに自動的に伝播されます。しかし、データベース側のインストールではこのように機能しません。ソフトウェアを各データベース・コンピュート・ノードにコピーして、直接インストールする必要があります。
Oracle Grid環境で、セル設定を更新する必要がある場合は、インストーラはグリッドの再起動が必要であることを警告します。(グリッドの再起動が必要な場合、これらの資格証明がないとインストールが完了しないため、グリッドのパスワードがあることを確認してください。)
ヒント:
一部の簡単な機能テストについては、『Oracle Big Data SQLユーザーズ・ガイド』のクイック・テストの実行方法に関する項を参照してください。考慮すべきインストール後手順
インストールを保護するために講じることができる対策について一読します。(「Big Data SQLの保護」を参照してください。)
HadoopクラスタやOracle Databaseインストールで変更が発生したときのOracle Big Data SQL構成の変更方法を理解します。(「HadoopクラスタおよびOracle Databaseの変更への適応」を参照してください。)
Oracle Big Data SQLの旧リリースでCopy to Hadoopを使用していた場合は、Oracle Shell for Hadoop LoadersによってCopy to Hadoopタスクを簡略化できる方法を理解してください。(「インストールされる追加ツール」を参照してください。)
インストール・ログ・ファイル
Hadoopクラスタ側:
/var/log/bigdatasql /var/log/oracle
Oracle Database側:
$ORACLE_HOME/install/bds* (This is a set of files, not a directory) $ORACLE_HOME/bigdatasql/logs /var/log/bigdatasql
ヒント:
サポート・リクエストを発行した場合は、これらのログをすべて含んだzipアーカイブを作成し、Oracleサポートへの電子メールに添付してください。
Oracle Big Data SQLはOracle Software Delivery Cloudからダウンロードします
表1-1 Oracle Big Data SQL製品バンドル・インベントリ
ファイルまたはディレクトリ | 説明 |
---|---|
BDSSetup/setup-bds |
クラスタ側のインストール・スクリプト |
BDSSetup/bds-config.json |
構成テンプレート・ファイル |
BDSSetup/deployment_manager/* |
デプロイメント・マネージャ・パッケージ |
BDSSetup/db/hadoop-*-nativelib-*.tar.gz |
Hadoopネイティブ・ライブラリ |
BDSSetup/db/bds-database-create-bundle.sh |
データベース側のインストール・バンドルを作成するスクリプト |
BDSSetup/db/database-install.zip |
データベース側の事前バンドル |