Oracle Big Data Cloud Machineをサブスクリプションすると、Apache Hadoop(CDH)やApache Sparkを含むClouderaディストリビューションの完全インストールなど、事前構成済みのOracle Big Data環境のリソースにアクセスできます。 Oracle Big Data Cloud Machineを使用して、ソーシャル・メディア・フィード、電子メール、Webログ、写真、スマート・メーター、センサーなどのデバイスによって生成された大量のデータをキャプチャして分析します。
Oracle Big Data Cloud Machineのサブスクリプションをオーダーする場合は、各クラスタに対して3つのノードからなるスタータ・パックを開始し、次にクラスタごとに必要な数のノードを追加することができます(クラスタごとに最大60個のノード)。 Oracleはハードウェアとネットワークのインフラストラクチャ全体と初期設定を管理しますが、管理者がソフトウェアを完全に制御することができます。
Oracle Big Data Cloud Machineインスタンス内のすべてのノードがクラスタを形成します。 各Oracle Big Data Cloud Machineラックは複数のクラスタ(インスタンス)をホストでき、大きなクラスタも複数のOracle Big Data Cloud Machineラックにまたがることができます。
ソフトウェア
Oracle Big Data Cloud Machineのサブスクリプションには、次のものが含まれます:
Oracle Linuxオペレーティング・システム
Apache Hadoop(CDH)を含むClouderaディストリビューション
CDHには、ファイルを格納して一連のコンピュータ間で作業を分散できるバッチ処理インフラストラクチャがあります。 データは、格納されているのと同じコンピュータで処理されます。 単一のOracle Big Data Cloud Machineクラスタでは、CDHはファイルとワークロードを複数のサーバーに分散し、クラスタを構成します。 各サーバーはクラスタ内のノードです。
CDHに含まれるもの:
ファイル・システム: Hadoop分散ファイルシステム(HDFS)は、スケーラビリティの高いファイルシステムで、大規模なファイルを複数のサーバーに格納します。 RAIDテクノロジを使用しないで複数のサーバーにデータを複製することで、信頼性を実現します。 これは、Linuxファイルシステムの上で動作します。
MapReduceエンジン: MapReduceエンジンは、Javaで記述されたアルゴリズムの大規模並列実行のためのプラットフォームを提供します。 Oracle Big Data Cloud MachineはデフォルトでYARNを実行します。
管理フレームワーク: Cloudera ManagerはCDHの包括的な管理ツールです。
Apacheプロジェクト: CDHには、Hive、Pig、Oozie、ZooKeeper、HBase、Sqoop、SparkなどのMapReduceとHDFS用のApacheプロジェクトが含まれています。
Clouderaアプリケーション: Oracle Big Data Cloud Machineには、Impala、Search、およびNavigatorを含むCloudera Enterprise Data Hub Editionに含まれるすべての製品が含まれています。
Oracle Big Data Cloud Machineで利用可能ないくつかのCDHユーティリティやその他のソフトウェアは、使いやすいグラフィカル、Webベース、およびその他の言語インタフェースを提供します。
Oracle Big Dataコネクタ。Apache Hadoopクラスタに格納されたデータへのアクセスを容易にします。
含まれるもの:Oracle SQL Connector for Hadoop分散ファイルシステム
Oracle Loader for Hadoop
Oracle XQuery for Hadoop
Oracle R Advanced Analytics for Hadoop
Oracle Data Integrator Enterprise Edition
Oracle Big Data Spatial and Graphは、Apache HadoopおよびNoSQL Database Big Dataプラットフォームをサポートする高度な空間およびグラフ・アナリティク機能を提供します。