2 インストール
Oracle Big Data SQLは、データが存在するHadoopシステムの他、データを問い合せるOracle Databaseサーバーにもコンポーネントをインストールする必要があります。
Oracle Big Data SQLのアーキテクチャは、Hadoop (またはNoSQL)クラスタ上の並列インストールと連動するOracle Databaseシステム(単一ノードまたはRAC)上のインストールで構成されます。この2つのシステムは、EthernetまたはInfiniBandのどちらかを通じてネットワーク接続できます。Oracle Databaseシステムのコンピュート・ノード上のHadoopおよびHiveクライアントにより、データベースとOracle Big Data SQLプロセス(Oracle Big Data SQLセルと呼ばれる)の間の通信が可能になります。このプロセスは、Hadoopクラスタの各DataNodesで実行されます。このメカニズムによって、Oracle DatabaseはHadoopクラスタ上のデータの問合せが可能になります。また、Oracle Big Data SQL Query Serverは、クラスタ上のエッジ・ノード上にデプロイでき、Oracle Big Data SQLセルに接続することもできます。詳細は、問合せサーバーの操作を参照してください。
Hadoop HDFSファイル・システム内およびObject Storage内のデータは不明な形式で保存されているため、SQL問合せには、行内と列内の処理対象データの解析と解釈のための、なんらかの構造が必要になります。Oracle Big Data SQLでは、HDFSでこれを実現するために、利用可能なHadoop構造(特にInputFormatおよびSerDe Javaクラス)が活用されます。必要に応じて、Hiveメタデータ定義も使用されます。オブジェクト・ストレージの場合、Big Data SQLでは、テキスト、Parquet、ORCおよびAvroファイル形式のデータへのアクセスに、高度に最適化されたCドライバが使用されます。DataNodes上のOracle Big Data SQL処理セルは、YARNによって管理され、Hadoopインフラストラクチャに統合されます。これらのセルは、Smart Scan、ストレージ索引、集計オフロードという3つの重要な機能を提供しています。ビッグ・データ・ソース用のスマート・スキャンについて、ストレージ索引についておよび集約オフロードについてを参照してください。
インストールの詳細は、次のリソースを参照してください。
-
Oracle Big Data SQLインストレーション・ガイドの概要
このガイドでは、サポートされているHadoopシステム/Oracle Databaseサーバーの組合せのためのインストールおよび構成の手順を説明します。
-
Oracle Big Data SQLマスター互換性マトリクス
これは、My Oracle Supportにあるドキュメント2119369.1です。Big Data SQLと次の項目との互換性に関する最新情報は、このマトリクスを確認してください。-
Oracle Engineered Systems。
-
その他のシステム。
-
Linux OSのディストリビューションとバージョン。
-
Hadoopディストリビューション。
-
必要とされるパッチを含むOracle Databaseのリリース。
-