Oracle Cloud InfrastructureにHadoopをデプロイする利点について

オンプレミスのHadoopデプロイメントがある場合、それをクラウドで移行または拡張することを検討している可能性があります。クラウドの動的な性質を利用してビジネスの機敏性を向上させ、価格とパフォーマンスの効率を向上させるアプローチを探しています。クラウドに移動すると、拡張度を利用して、使用するリソースの支払のみを行い、オープン・ソースの標準およびソフトウェアとの相互運用性を得て、常に最新の最速のハードウェア上で実行されているデータを使用してストレージのパフォーマンスを改善できます。このソリューションでは、移行または拡張の一部として対処する必要がある主要な実装上の技術要件および既存のビジネス上の課題を説明することで、HadoopをOracle Cloud InfrastructureにデプロイするためのOracle推奨アプローチを提供します。さらに、アプリケーション環境および要件に最も適切に連携する、サポート・クラウド・サービス、サード・パーティ統合およびデプロイメント・プラクティスの概要が示されています。これは、以前に正常にデプロイメントによって検証された複数のユースケースから参照アーキテクチャを提供し、Cloudera、Hortonworks、MapRおよびApacheを使用してHadoopをデプロイするためのテンプレートを提供します。

値の配置

オンプレミスのHadoopデプロイメントのほとんどは、重要な構成、統合またはプロセスの変更を必要とせずにOracle Cloud Infrastructureで実行するように移行できます。結果の実装は、柔軟性が高く、信頼性が高く、より優れており、オンプレミスまたは他のクラウド・デプロイメントよりコストが低くなります。

Hadoopは、クラウドIaaSの動的な性質を利用し、データ階層化(複数層のクラウド・ストレージを活用)によって拡張されます。これにより、顧客がHDFSの柔軟なストレージ密度を満たすための計算要件を満たすようにチューニングできる、より堅牢でコスト効果の高いソリューションが提供されます。

Oracleには、このような目標をすぐに確実に達成できるように検証されたソリューションがあります。このソリューションには、手順、Oracle Cloud Infrastructureプラットフォーム・サービスのサポート、および参照アーキテクチャが含まれています。これらは、セキュリティ、ネットワーク構成、高可用性(HA )、障害回復(DR )、id統合、原価管理など、実際の本番ニーズについて考慮します。

Oracleのソリューションには次のものがあります。

  • 37%下部の総所有コスト(TCO)がオンプレミス・デプロイメントよりも低く、68%低いTCOが競合クラウド・ソリューションよりも優先されます
  • 是正・予防処置の管理と削減。サーバー・ハードウェアをなくしながら、可能な場合はクラウドの柔軟性を活用して、データ・センターのメンテナンスを効率的に行うことができます。
  • 高速インプレース・テクノロジのリフレッシュおよびパッチ適用
  • 使用状況とコストのプロアクティブな監視
  • 付近のインスタンスは拡大またはワークロード・バーストを処理するためにスケール・アップまたはダウンします
  • 既存のシステムとのフェデレーテッドId管理
  • Terraformテンプレートを利用し、Hadoopクラスタを数日ではなく数分でデプロイする高速デプロイメント
  • 補給されていないメモリーの非常に高いパフォーマンス(NVMe)でバックアップされたHadoop Distributed File System (HDFS)

出資比率の合計分析

HadoopをOracle Cloud Infrastructureで実行すると、オンプレミスまたは別のクラウド・システムで実行するよりもはるかに柔軟に移行し、管理が容易で柔軟性が高いというメリットがあります。

このソリューションの合計所有費用の見積は、次のものに基づく、オンプレミスでのHadoopの実行よりも37%少なく、別のクラウドでの実行より68%少なくなります:

  • 2つの環境がある場合: 1つは本番用、もう1つは開発用とテスト用に組み合せられます
  • ブロック・ボリュームおよびデータベース記憶域に対するOracleの重要なコストの利点
  • Hadoopに対して21個のノード、Hadoopサービスに対して3個、アクティブ/バックアップ・クラウラ・マネージャは2個、期間のアクセスは3、オブジェクト・ストレージは500 TB、ブロック・ボリュームは7.25 TB
  • 8 - 52コア、64から768 GBメモリー、2.2 PB NASストレージおよび500 GBバックアップを持つ58サーバーを含む2つのオンプレミス環境と比較
  • Oracle以外のクラウドの競合に対して使用可能な類似のリソースと比較した場合

一意のインフラストラクチャおよびツール

Oracleは、Hadoopをホストするための理想的なインフラストラクチャおよびツールを提供します。

ベア・メタルの稠密な形状は、Hadoopのワークロードに対して、メモリー密度が高く、HDFS用の高速なローカルNVMeストレージを抑制する最高のパフォーマンスを提供します。ブロック・ボリュームを使用すると、ローカル・ストレージを補強できます。これにより、ワーカー・ノードの数に応じて拡張することなくHDFSストレージ・ターゲットを達成できます。多くのHadoopデプロイメントで発生する大きな問題の1つは、ストレージ要件は通常ワークロード要件よりも大幅に高速で、物理ハードウェア・デプロイメントの静的な性質ではアイドル状態のコンピュート・リソースを導くことです。さらに、ベアメタル・インスタンスは、高速で低遅延を実現する、クラスタ内通信を容易にするデュアル25 Gbpsのネットワーク・インタフェースを備えています。これをすべて、フォルト・ドメイン全体に高可用性デプロイメントと組み合せ、堅牢でスケーラブルな、パフォーマンスの高いクラウド・ベースのHadoopソリューションを提供します。

企業顧客成功

金融サービス産業の顧客は、オンプレミスのHadoopクラスタを移行するためにOracle Cloud Infrastructureを選択しました。これらのデプロイメントは、Oracle Cloud InfrastructureベースのHadoopデプロイメントの実用的な例として機能し、顧客に提供するメリットをもたらします。

この移行には、すべての本番データ、データ・フィードおよび追加のアプリケーション・インフラストラクチャの移動が含まれます。Hadoop環境には、ローカルNVMeをHadoopに活用するベア・メタルDenseIO Intelホストが含まれています。顧客は、最初のサイズを1: 1のサーバー率に設定した後、環境を適切なサイズに設定できました。これにより、Oracle Cloud Infrastructureデプロイメントでオンプレミス・デプロイメントのメモリーが同じノード数を持つ3倍になったため、フットプリントが特定のメモリー・ターゲット(HBaseおよびSparkの場合)に達するのを減らすことができました。

Oracle Cloud Infrastructureへの移動によって顧客は次の目標を達成できます。

  • パフォーマンスの向上
  • 原価の削減
  • リソースのプロビジョニング時間を120日から数時間に削減
  • 週または月と比較して、需要を満たすためのスケーリング機能を分単位で改善

次の図は、Oracle Cloud Infrastructureにおける顧客の生産配置を表しています。


Architecture - ustomer-reference.pngの説明が続きます
図architecture-customer-reference.pngの説明

デプロイメントには次の構成があります。

  • 21 HadoopのBM.DenseIO2.52 bare金属製ワーカー(HDFS用の1 - PB raw NVMeE)
  • 3 VM: Hadoopサービスの標準2.24マスター・ノード
  • 2 VM.アクティブ/バックアップ・クラウラ・マネージャ用のユーティリティ・ノード
  • 3 VM .Standard2.8 Edge VM for perimeterアクセス
  • コールド・データ用の500 TBのオブジェクト・ストレージ
  • 7.25 TBのブロック・ボリュームで、ログ、区画およびアプリケーション・データのOSを拡張

ビジネス要件に対応する検証済ソリューション

Cloudera、HortonworksおよびMapRは、Oracle Cloud InfrastructureでサポートされているHadoop独立系ソフトウェア・ベンダー(ISv)上で検証されます。このソリューションには、これらの各製品の詳細が含まれています。

Oracle Cloud Infrastructureは、エンタープライズ本番アプリケーションの使用パターン用に構築されたため、既存のHadoopデプロイメントはOracle Cloud Infrastructure内で簡単に移動し、改善することもできます。Oracleには、ネットワーキング、接続性、パフォーマンス、HA、DRおよび複数リージョンの要件をすべて満たすアーキテクチャ・パターンが用意されています。実際、ほとんどの顧客は、Oracle Cloud InfrastructureでのHadoopのパフォーマンスがオンプレミス・デプロイメントのパフォーマンスを超えていることを確認しました。

Oracleでは、Oracle Cloud InfrastructureのHadoopを迅速にデプロイおよび構成するためのTerraformテンプレートも開発されています。これらのテンプレートにより、HadoopをOracle Cloud Infrastructureでプロビジョニングする複雑さと時間が短縮され、Hadoopの移行またはデプロイメントを効率的にカスタマイズして利用できるフレームワークとなります。