Migrieren Sie Hadoop mit dem Migrator WANdisco LiveData zu Oracle
LiveData Migrator wird auf einem Edge-Knoten des Hadoop-Clusters bereitgestellt. Das Deployment erfolgt in Minuten ohne Auswirkung auf die aktuellen Produktionsvorgänge. Benutzer können das Produkt sofort über die Befehlszeile, die REST-API oder die Benutzeroberfläche (UI) zur Ausführung der Migration verwenden.
Migration von Hadoop-Daten
Im Folgenden werden die typischen Schritte bei der Migration von Apache Hadoop zu Cloud beschrieben:
Das folgende Diagramm zeigt die Ablaufarchitektur und die Komponenten.

Beschreibung der Abbildung wasoop-lakehouse-migration.png
Hadoop-lakehouse-migration-oracle.zip
- Discovery: Identifizieren Sie die Datasets und Workloads, die in die Cloud migriert werden sollen.
- Planung: Entwickeln Sie einen Plan und eine Zeitleiste für die Phasen, in denen die Migration ausgeführt wird.
- Datenmigration: Durchführen der Migration der erforderlichen Daten von der On-Premise-Hadoop-Umgebung in die Cloud.
- Workload-Migration: Durchführen der Migration der Workloads und/oder Anwendungen von der On-Premise-Umgebung in die Cloud.
- Neue Analytics-Entwicklung: Beginnen Sie mit der Entwicklung neuer Analysen, KI und maschinellem Lernen, und nutzen Sie dabei die neue Cloud-Umgebung.
- Messen und Handeln: Führen Sie Analysen durch, um KPIs zu messen, die Performance zu bewerten, Vorhersagen zu treffen und dem Unternehmen die Möglichkeit zu geben, angemessen zu handeln.
Um die Cloud-Migration zu vereinfachen, folgen viele Organisationen einer "Lift-and-Shift"-Migrationsstrategie. Diese Strategie setzt die vereinfachte Annahme voraus, dass die Migration durchgeführt werden kann, ohne Änderungen an Daten oder Anwendungen vorzunehmen. Die Logik lautet: "Verschieben Sie sie einfach in die Cloud." Diese Annahme führt zu vielen fehlgeschlagenen Projekten oder Projekten, die ihre Zeit und Kosten überschreiten. Es erfordert entweder, dass vorhandene Systeme heruntergefahren werden, um sicherzustellen, dass keine Datenänderungen auftreten, oder dass Unternehmen Zeit haben, benutzerdefinierte Lösungen für die Verarbeitung von Datenänderungen zu entwickeln. Andere Vorteile dieser Strategie sind zum einen, dass Unternehmen einen Big-Bang-Cutover aller Anwendungen und Daten gleichzeitig ausführen müssen und zum anderen keine neuen Cloud-Funktionen nutzen.
WANdisco fördert einen Data-First-Ansatz bei Data Lake-Migrationen. Bei einem Data-First-Ansatz müssen die Daten schnell verschoben und nicht alle vorhandenen Anwendungen gleichzeitig migriert werden. Durch diesen Fokus stehen die Daten den Data Scientists schneller zur Verfügung, damit sie von Anfang an mit den migrierten Daten arbeiten können. Dies ermöglicht viel schnellere Einblicke und neue KI-Innovationen. Unternehmen können einen deutlich schnelleren ROI bei der Cloud-Migration belegen, während die vorhandenen On-Premise-Produktions-Workloads weiterhin ohne Auswirkungen ausgeführt werden können. Diese Lösung bietet außerdem Flexibilität bei der Anwendungs- und Workload-Migration. Damit werden Big-Bang-Ansätze vermieden und Unternehmen die Zeit zur Optimierung der Workloads für die neue Cloud-Umgebung zur Verfügung gestellt. So wird sichergestellt, dass diese optimal ausgeführt werden und profitieren von den neuen Funktionen, die ihnen zur Verfügung stehen. Organisationen können so viele parallele Tests durchführen wie nötig, um sicherzustellen, dass keine versteckten Kosten anfallen. Bei einem Data-First-Ansatz können sie zudem ermitteln, ob einige Anwendungen überhaupt nicht migriert werden müssen, sondern stattdessen die neu auftretende Entwicklung ersetzen.
Quellen und Ziele definieren
Während des Deployments erkennt WANdisco LiveData Migrator automatisch das Quellcluster Apache Hadoop Distributed File System (HDFS), sodass Sie nur die Zielumgebung definieren müssen.
Migration definieren
Migrationen übertragen vorhandene Daten von der Quelle auf das definierte Ziel. WANdisco LiveData Migrator migriert alle Änderungen, die während der Migration an den Quelldaten vorgenommen wurden, und stellt sicher, dass das Ziel mit diesen Änderungen auf dem neuesten Stand ist. Dies geschieht, während die Migration fortgesetzt wird.
Benutzer erstellen in der Regel mehrere Migrationen, sodass sie bestimmte Inhalte aus dem Quelldateisystem nach Pfad auswählen können. Sie können auch mehrere unabhängige Dateisysteme gleichzeitig migrieren, indem Sie mehrere Migrationsziele definieren.
Um eine Migration zu erstellen, geben Sie einen Migrationsnamen an, wählen Sie die Quell- und Zieldateisysteme aus, und geben Sie den Pfad im zu migrierenden Quelldateisystem an. Optional können Sie Ausschlüsse anwenden, um Regeln für Daten anzugeben, die von einer Migration ausgeschlossen werden sollen, und andere optionale Konfigurationseinstellungen anwenden.
LiveData Migrator unterstützt auch die Migration von Hive-Metadaten von Quell- zu Zielmetastores. LiveData Migrator stellt über lokale oder Remote-Metadaten-Agents eine Verbindung zu Metastores her. Metadatenregeln werden dann zur Definition der Metadaten verwendet, die von der Quelle zu dem Ziel migriert werden sollen.
Beim Definieren der Migrationen können Sie angeben, dass die Migration automatisch gestartet wird und ob es sich um eine Livemigration handelt. Das bedeutet, dass fortlaufende Änderungen von Quelle zu Ziel kontinuierlich übernommen werden.