WANdisco LiveData Migratorを使用したHadoopのOracleへの移行
LiveData Migratorは、Hadoopクラスタのエッジ・ノードにデプロイされます。デプロイメントは、現在の本番操作に影響を与えずに数分で実行されます。ユーザーは、コマンドライン、REST APIまたはユーザー・インタフェース(UI)を使用して移行を実行することで、すぐに製品の使用を開始できます。
Hadoopデータの移行について
Apache Hadoopからクラウドへの移行に関連する一般的なステップを次に示します。
次の図は、フロー・アーキテクチャとコンポーネントを示しています。

図hadoop-lakehouse-migration.pngの説明
hadoop-lakehouse-migration-oracle.zip
- 検出:クラウドに移行するデータ・セットとワークロードを特定します。
- 計画:移行が実行されるフェーズの計画とタイムラインを作成します。
- データ移行:オンプレミスのHadoop環境からクラウドへの必要なデータの移行を実行します。
- ワークロードの移行:オンプレミス環境からクラウドへのワークロードまたはアプリケーションの移行を実行します。
- 新しいアナリティクス開発:新しいアナリティクス、AIおよび機械学習の開発を開始し、新しいクラウド環境を活用します。
- 測定と対応:分析を実行して、KPIを測定し、パフォーマンスを評価し、予測を行い、ビジネスが適切に対処できるようにします。
クラウド移行を試して簡素化するために、多くの組織は「リフト・アンド・シフト」移行戦略に従うことにしました。この戦略により、データやアプリケーションを変更せずに移行を実行できることが簡単に想定されます。ロジックは、「そのままクラウドに移行する」ことです。この仮定では、時間とコストを超える多くの失敗プロジェクトまたはプロジェクトが生成されます。データ変更が発生しないように既存のシステムをシャットダウンするか、データ変更に対応するためにカスタム・ソリューションの開発に時間を費やす必要があります。この戦略のもう1つのデメリットは、まず、組織がすべてのアプリケーションとデータを同時にビッグ・バング・カットオーバーすることを必要とし、次に、新しいクラウド機能を利用しないことです。
WANdiscoは、データ・レイク移行へのデータファーストのアプローチを促進します。データファーストのアプローチは、データの移動に重点を置き、既存のすべてのアプリケーションを同時に移行しようとしないことに重点を置いています。これにより、データ・サイエンティストがデータを使用できる速度が向上し、移行されたデータの処理が1日目から開始されます。これにより、新しいインサイトや新しいAIイノベーションにかかる時間を大幅に短縮できます。組織は、クラウド移行におけるROIを大幅に高速化しながら、既存のオンプレミスの本番ワークロードでは影響を受けないまま継続できます。この方法では、アプリケーションおよびワークロードの移行に柔軟性も提供されます。これにより、ビッグバンによるアプローチが回避され、新しいクラウド環境のワークロードを最適化する時間を組織に提供できるため、最適な実行を確保し、利用可能な新しい機能を活用できます。組織は、隠れたコストを発生させないように、必要なだけパラレル・テストを実施できます。また、データファーストのアプローチでは、一部のアプリケーションを移行する必要がないが、既存の新しい開発と置き換える必要がないかどうかを判断する時間も提供されます。
ソースおよびターゲットの定義
デプロイメント中、WANdisco LiveData MigratorはソースApache Hadoop Distributed File System (HDFS)クラスタを自動的に検出するため、ターゲット環境のみを定義する必要があります。
移行の定義
移行により、既存のデータがソースから定義済ターゲットに転送されます。WANdisco LiveData Migratorは、移行中にソース・データに加えられた変更を移行し、これらの変更でターゲットが最新であることを確認します。これは、移行の実行を継続しながら行います。
通常、ユーザーは複数の移行を作成し、パスごとにソース・ファイルシステムから特定のコンテンツを選択できます。複数の移行ターゲットを定義することで、複数の独立したファイルシステムに同時に移行することもできます。
移行を作成するには、移行名を指定し、ソースおよびターゲットのファイルシステムを選択し、移行するソースファイルシステムのパスを指定します。オプションで、除外を適用して、移行から除外する必要があるデータのルールを指定し、その他のオプションの構成設定を適用できます。
LiveData Migratorでは、ソース・メタストアからターゲット・メタストアへのHiveメタデータの移行もサポートされています。LiveData Migratorは、ローカルまたはリモートのメタデータ・エージェントを使用してメタストアに接続します。その後、Metadataルールを使用して、ソースからターゲットに移行するメタデータを定義します。
移行を定義するときに、移行を自動的に開始し、ライブ移行であるかどうかを判断するように指定できます。つまり、ソースからターゲットへの進行中の変更を継続的に適用します。