解決策パターンの選択に関する考慮事項

クラウド上にデータ・レイクを実装する場合は、現在のデータ・レイクをOracle Cloudに移行するための推奨設計パターンを検討してください。

移行プロジェクトの準備

データをOracle Cloudに移行する場合は、プロジェクトと人材配置を計画する必要があります。ソリューション・パターンを選択する前に、ネットワーキングおよびストレージに関する情報を収集し、メリットとデメリットを比較します。移行の範囲内でシステムおよびアプリケーションの概要レベル説明を作成します。

お客様の環境、スケジュール、チームのスキル・レベルに基づいて、当社の推奨事項を検討してください。

プロジェクトおよびスコープを計画します。プロジェクト・マネージャ、アプリケーション所有者、ビッグ・データ・エンジニア、インフラストラクチャとセキュリティのためのOCIエンジニア、開発者を含むプロジェクト・チームを特定します。アプリケーション開発者とパフォーマンスとテスト・エンジニアを必ず含めます。重要な日付およびプロジェクト・マイルストンを決定します。

システムとアプリケーションの概要を作成するには、次の例を使用します。

コンポーネント 摘要
Big Data Appliance (BDA)

CDHディストリビューションでBDAアプライアンスを実行

24ノードBDA (6x Dev、6x DR、12x Prod)

  • 2x 22コアXeon
  • 2x40 IB、4x10 Ethernet
  • 96 TBディスクと256 GB RAM
用途
  • 300TB HDFS(推定500GB/日)
  • 30% CPU
  • 1TBのRAM
  • オンライン24x7
環境

生産、開発、ディザスタ・リカバリ

ソリューション・コンポーネント
  • Hive
  • HBase
  • HDFS
  • Spark (Scala)
  • Kerberosと Active Directory
  • Sqoop
  • Oozie
  • 分析: OBIEE
  • 外部ソースに接続するためのJDBCドライバ

ネットワーキングおよびストレージに関する考慮事項

データ・レイクの移行を計画する際には、すべてのネットワーク資産とストレージ資産に関する情報を収集し、データをOCIに移行する最適な方法を決定してください。

次の表に、OCIのデータ移行オプションの一般的な高度なガイダンスを示します。

移行ソース Data Volumes < 1 TB 1TBから50TBまでのデータ・ボリューム Data Volumes > 50TB
Big Data Appliance (BDA)またはオンプレミスの自己管理型Hadoopクラスタ

ハードウェアVPNトンネル

(FastConnectが使用できない場合)

FastConnect(推奨)

ハードウェアVPNトンネルは、帯域幅が100 Mbpsを超える場合に使用できます
Data Transfer Appliance
Big Data Cloud Service (BDCS) ソフトウェアVPNトンネル

組織の要件と制約に基づいて、これらのオプションから1つ選択します。データ転送に必要な時間は、選択した移行方法によって異なります。

  • 1つのData Transfer Applianceによるオフライン転送では、1回につき最大150TBのデータ転送と、各データ転送ジョブに複数のアプライアンスを転送できます。出荷時間を含めて、移行の完了には数日かかります。
  • VPNトンネルまたはFastConnectを使用したインターネットを介したオンライン・データ転送の場合、この式を使用して、必要なおおよその時間を取得できます。

    Number of days = (Total Bytes)/(Megabits per second * 125 * 1000 * Network Utilization * 60 seconds * 60 minutes * 24 hours)

    この式を使用して、ネットワーク利用率が100%の1Gbps FastConnect接続により最大50TBのデータを転送すると、データ転送は6日で完了します。FastConnectは、下位ボリュームを構成している場合にも使用できます。10 Gbps FastConnectの場合、この時間は1/10になります。

  • VPNトンネルが10 Mbps接続で1 TBを転送し、ネットワーク使用率が80パーセントの場合、データ転送には約13日かかります。または、ネットワーク接続がこの接続より小さいか、信頼性が低い場合は、Data Transfer Applianceを使用します。

次の表に、接続帯域幅とデータ・セットのサイズに基づいた、OCIへのデータ・アップロード時間の概算を示します。

データ・セット・サイズ 10 Mbps 100 Mbps 1Gbps 10Gbps Data Transfer Service
10TB 92日間 9日 22時間 2時間 1週
100TB 1,018日間 101日間 10日 24時間 1週
500TB 5,092日間 509日間 50日間 5日間 1週
1Pバイト 10,185日間 1,018日間 101日間 10日 2週

ソリューション・アーキテクチャの設計

ソリューション・パターンを計画する際には、意思決定を行う前に、次の表の利点とデメリットを考慮してください。

ソリューション・パターン 利点 デメリット
クラウド・ネイティブ(未開拓領域)
  • 最新で将来に対応したスタックに移行可能
  • 最小の継続的な運用と管理オーバーヘッド
  • 最大投資対効果(ROI)および最小コスト・オプション(ほとんどの顧客)
  • 特定のコンポーネントを独自に実装する必要がある機能にギャップがある場合があります。
  • 他のパターンよりも実装に必要な作業が多い
Big Data Service (Greenfield)
  • 管理データとAIサービスの使用による、コストの低減と運用上のオーバーヘッドのメリット
  • Oracle Cloudへの移行において、長期および短期のソリューションとして機能します
  • 他のパターンよりも実装に必要な作業が多い
再構築(移行)
  • 最新で将来に対応したスタックに移行可能
  • 最小の継続的な運用と管理オーバーヘッド
  • 最大ROIと最小コストのオプション
  • 一部のコンポーネントを自分で実装する必要がある機能にギャップがある場合があります。
  • 他のパターンよりも実装に必要な作業が多い
プラットフォームの再構築(移行)
  • 管理データとAIサービスの使用による、コストの低減と運用上のオーバーヘッドのメリット
  • Oracle Cloudへの移行とともに、長期にわたるソリューションとして機能します。
  • 他のパターンよりも実装に必要な作業が多い
再ホスト(移行)
  • 機能の最小の中断
  • 使用の観点から学ぶ新しいものはありません
  • 業務とサポートの職責が増加
  • 既存のライセンスが有効でない可能性があります

ソリューション・パターン選択のレビュー基準

組織に最適なパターンを決定する場合は、これらの基準を検討します。近代化、投資対効果(ROI)、総所有コスト(TCO)の削減、実装の容易さと期間、継続的なコスト、運用効率、柔軟性、スケーラビリティ、可用性、既存のコードに対する相対的な変化などの基準を検討します。

次の表に、組織のニーズを満たすパターンの決定に役立つ上位レベルの基準を示します。

ソリューション・パターン 近代化の関係度 ROIとTCO節約の相対ポテンシャル 導入の容易さと期間 相対継続コスト削減、運用効率 相対弾力性、スケーラビリティ、可用性 既存のコードおよびワークフローに対する相対的な変更
クラウド・ネイティブ(未開拓領域) 高(最高) 高(最高) 中(良) 高(最高) 高(最高) なし
Big Data Service (Greenfield) 中(良) 中(良) 中(良) 中(良) 中(良) なし
再構築(移行) 高(最高) 高(最高) 低(良) 高(最高) 高(最高) 高(良)
プラットフォームの再構築(移行) 中(良) 中(良) 中(良) 中(良) 中(良) 中(良)
再ホスト(移行) 低(良) 低(良) 高(最高) 低(良) 低(良) 低(最高)

環境要件、タイムラインおよびチーム・スキルに応じて、Oracleではニーズに最適なパターンを使用することをお薦めします。

組織に最適なソリューションを決定する際には、次の点を考慮してください。

  • 多くの顧客は、クラウド導入の道のりに複数のパターンを使用しています。
  • 実際のランキングは、特定の顧客コンテキストおよびユースケースによって異なります。
  • すべてのお客様のニーズに合う単一のパターンはありません。
  • その他の基準には、顧客の好み、専門知識、独自の要件があります。