Migrationstools verwenden, um Daten in OCI Cloud Storage Services zu verschieben
Einführung
Dieses Tutorial 1 einer vier Tutorialreihe zeigt Ihnen verschiedene Möglichkeiten zur Migration von Daten in Oracle Cloud Infrastructure (OCI)-Cloud-Speicherservices. Die Serie ist so eingerichtet, dass Sie dieses erste Tutorial lesen können, um ein umfassendes Verständnis der verschiedenen Tools zu erhalten und dann mit den zugehörigen Tutorials oder Dokumenten fortzufahren, die für Ihre Migrationsanforderungen relevant sind.
OCI bietet Kunden High-Performance-Computing und kostengünstige Cloud-Speicheroptionen. Über lokalen On-Demand-, Objekt-, Datei-, Block- und Archivspeicher adressiert Oracle wichtige Anforderungen an die Speicher-Workload und Anwendungsfälle.
OCI-Cloud-Speicherservices bieten schnelle, sichere und dauerhafte Cloud-Speicheroptionen für alle Unternehmensanforderungen. Beginnen Sie mit den leistungsstarken Optionen wie OCI File Storage with Lustre und OCI Block Volumes Service; vollständig verwaltete Exabyte-Skalierungs-Dateisysteme vom OCI File Storage-Service mit leistungsstarken Mountzielen; bis hin zu extrem langlebigem und skalierbarem OCI Object Storage. Unsere Lösungen können Ihre Anforderungen erfüllen, von leistungsintensiven Anwendungen wie KI/ML-Workloads bis hin zu Data Lakes im Exabyte-Bereich.
Viele Kunden finden die Notwendigkeit, Daten von On Premise, einem anderen Provider oder zwischen OCI-Cloud-Speicherservices in den OCI-Cloud-Speicherservice zu übertragen. Je nach Herkunft, Ziel und Richtung der Datenübertragung kann die beste Methode für die Migration variieren. Nachdem Sie die Grundlagen der Datenquelle und des Ziels in OCI identifiziert haben, müssen Sie sich für einen Migrationspfad entscheiden und welche Tools Sie verwenden müssen. Lassen Sie sich von unserer praktischen Erfahrung zum richtigen Migrationstool und zur Verwendung führen. Dieses Tutorial 1 in einer Reihe stellt Ihnen verschiedene Tools vor und erläutert, wo sie am besten in den Migrationsprozess passen.
Bestimmen Sie die Datenmenge, die migriert werden muss, und die Ausfallzeit, die für den Cutover auf die neue OCI-Speicherplattform verfügbar ist. Batchmigrationen sind eine gute Wahl, um die Migration in verwaltbare Inkremente aufzuschlüsseln. Durch Batchmigrationen können Sie Ausfallzeiten für bestimmte Anwendungen über verschiedene Fenster hinweg planen. Einige Kunden haben die Flexibilität, eine einmalige Migration über ein geplantes Wartungsfenster über 2-4 Tage durchzuführen. OCI FastConnect kann verwendet werden, um eine dedizierte, private Verbindung zwischen OCI und Ihrer Umgebung zu erstellen. Portgeschwindigkeiten von 1G bis 400G beschleunigen den Datenübertragungsprozess. OCI FastConnect kann in Partnerlösungen wie Megaport und ConsoleConnect integriert werden, um eine private Verbindung zu Ihrem Data Center oder einer Cloud-zu-Cloud-Verbindung herzustellen, um Daten direkt von einem anderen Cloud-Anbieter in den OCI-Cloud-Speicherservice zu verschieben. Weitere Informationen finden Sie unter Integration mit Megaport Cloud-Router FastConnect.
Zielgruppe
DevOps Ingenieure, Entwickler, OCI-Cloud-Speicheradministratoren und -benutzer, IT-Manager, OCI-Poweruser und Anwendungsadministratoren.
Ziele
Erfahren Sie, wie Sie mit verschiedenen Tools Daten in OCI Cloud-Speicherservices kopieren und synchronisieren:
-
Identifizieren Sie gemeinsame Migrationstools.
-
Erfahren Sie mehr über die verschiedenen Tools für die Migration von Dateisystemdaten (lokal, NAS, in der Cloud gehostet) in OCI-Cloud-Speicherservices.
-
Erfahren Sie, welches Tool am besten für verschiedene Anwendungsfälle geeignet ist.
Voraussetzungen
-
Ein Verständnis Ihres Datenmigrationssets, der Gesamtgröße und der Darstellung der Dateien oder Objekte (wenige große Dateien, viele kleine Dateien usw.).
-
Im OCI-Cloud-Speicherservice (Object Storage, File Storage oder Block Volumes) sollte der Speicher landen.
-
Ihre Zeitleisten und wenn Sie eine Massen- oder inkrementelle (Batch-)Migration durchführen.
Migrationstools
Unsere Kundenerfahrung und Tests können Ihnen helfen, zu bestimmen, welches Migrationstool am besten zu Ihrem Szenario passt. Wir empfehlen Ihnen, einen Proof of Concept und Tests an Beispieldatensätzen durchzuführen, um die beste Migrationsmethode für Ihr Dataset zu überprüfen. Wir untersuchen die gängigen Migrationstools, die verfügbar sind, um Daten von On-Premises- und anderen Cloud-Providern zu OCI oder innerhalb von OCI-Cloud-Speicherservices zu migrieren. Testergebnisse werden aus Beispiel-Datasets gemeinsam verwendet, sodass Sie extrapolieren können, wie die Tools mit Ihrem Dataset arbeiten können.
-
Rclone: Rclone ist ein Open-Source-Befehlszeilenutility zur Migration von Daten in die Cloud oder zwischen Cloud-Speicheranbietern. Rclone kann zur einmaligen Migration sowie zur regelmäßigen Synchronisierung zwischen Quell- und Zielspeicher verwendet werden. Rclone kann Daten zu und von Objektspeicher, Dateispeicher, gemounteten Laufwerken und zwischen 70 unterstützten Speichertypen migrieren. OCI Object Storage wird nativ als Rclone-Backend-Provider unterstützt. Rclone-Prozesse können mithilfe von Parameteroptionen vertikal und horizontal skaliert werden, um die Übertragungsleistung zu erhöhen. Rclone verfügt über Optionen wie Kopieren und Synchronisieren, um Daten einmalig bzw. regelmäßig zu übertragen. Weitere Informationen hierzu finden Sie unter Install Rclone.
-
Flexify IO: Flexify IO ist ein benutzerfreundliches Migrationstool von Drittanbietern, das sich auf den Objektspeicher konzentriert. Flexify arbeitet mit der S3-kompatiblen Cloud (OCI, AWS, GCP, Azure und mehr) und dem On-Premise-Objektspeicher (Minio, Dell EMC ECS und andere). Melden Sie sich einfach bei Flexify management an, konfigurieren Sie Zugangsdaten/Zugriffsschlüssel, und richten Sie die Migration über eine grafische Benutzeroberfläche (GUI) ein. Der horizontale Skalierungsalgorithmus von Flexify IO wird automatisch so schnell skaliert, wie die Konnektivität und der Speicher es zulassen. Flexify ist außerdem in Network as a Service-(NaaS-)Provider wie den OCI-Partner Megaport integriert und kann schnelle Verbindungen On-Demand bereitstellen/deprovisionieren. Weitere Informationen finden Sie unter Daten zwischen Clouds migrieren und Megaport- und Flexify-I/O-Lösung.
-
Resilio Active Anywhere: Resilio ist eine Agent-basierte Datenübertragungsanwendung eines Drittanbieters. Es ist eine umfangreiche grafische Benutzeroberfläche (GUI) und bietet eine hervorragende Kontrolle über die Übertragungsjobs sowie die Visualisierung der Leistungsmetriken. Die Software ist im Oracle Cloud Marketplace verfügbar und wird von Resilio zur Installation lizenziert. Resilio kann Dateien in festen Zeitrahmen in jede Richtung in einem n:n-, n:n- oder n:n-Mesh synchronisieren, wodurch eine globale Präsenz in einem Dataset ermöglicht wird. Weitere Informationen finden Sie unter Datenmigration zu und zwischen OCI-Speicherservices mit Resilio Connect und Resilio Active Anywhere.
-
Open Source Linux Sync-Dienstprogramme: rsync und fpsync.
-
Rsync: Allgemeines Unix-basiertes Tool zum einmaligen Kopieren oder regelmäßigen Synchronisieren zwischen Quell- und Zielpfaden.
-
Fpsync: Open-Source-Tool zur parallelen Synchronisierung. Es verwendet rsync, tar oder rclone darunter und führt oben einen parallelen Wrapper aus. Sie können entweder rsync, tar oder rclone als zugrunde liegendes Synchronisierungstool auswählen.
-
-
File Storage Parallel Tools verwenden: OCI File Storage hat ein paralleles Toolpackage bereitgestellt, das optimal mit dem Dateisystem funktioniert. Es ist mit dem Linux Developer Repository verfügbar und kann direkt aus dem yum Repository installiert werden. Das Paket enthält drei Tools, die parcp, parter und param sind und parallel den Standard-Linux-Dienstprogrammen cp, tar und rm entsprechen.
-
OCI-Befehlszeilenschnittstelle - Object Storage-Synchronisierung: OCI Object Storage Sync (OS-Synchronisierung) ist Teil der OCI-Befehlszeilenschnittstelle (CLI), die ein Dateisystemverzeichnis mit Objekten in einem Bucket synchronisiert. Der Befehl durchläuft Unterverzeichnisse, in denen neue und geänderte Dateien oder Objekte von der Quelle in das Ziel kopiert und optional diejenigen gelöscht werden, die nicht in der Quelle vorhanden sind. Es kann bis zu 1.00 parallele Vorgänge ausführen, abhängig von Hostrechnerressourcen.
-
Python-API zum globalen Kopieren von OCI Object Storage: Der folgende Link ist ein Beispiel für ein Bulkkopierskript, das die python-API für OCI verwendet. Mit der API können Skripte wie das Beispielskript geschrieben werden, das parallele Threads verwendet, um Objekte aus einem Bucket in einen anderen zu kopieren. Weitere Informationen zur Verwendung des Beispielskripts finden Sie unter Oracle Cloud Infrastructure Object Storage Python-Utilitys für Bulkvorgänge verwenden.
-
S3 Kompatibles Tool (s5cmd): s5cmd ist ein Open-Source-Tool, mit dem lokale Dateisysteme und NAS-Speicher (On Premise und in OCI) in OCI Object Storage migriert oder synchronisiert werden können. Es kann auch verwendet werden, um Daten-Bucket-zu-Bucket innerhalb derselben Region zu migrieren.
Das richtige Tool für den Job
Es gibt viele Tools zur Auswahl, wenn Sie eine Migration durchführen, und es kann überwältigend sein, sie alle auf einmal zu recherchieren. Je nach Herkunft, Ziel, Migrationsrichtung, Benutzererfahrung und Benutzerumgebung ist das beste Migrationstool unterschiedlich.
Die folgende Tabelle enthält Empfehlungen für gängige Migrationsszenarios, einschließlich der Migration von On-Premise-Daten, der Migration von Daten von einem anderen Cloud-Anbieter in OCI, dem Kopieren von OCI-Cloud-Speicherdaten von einer Region in eine andere, dem Kopieren von OCI-Cloud-Speicherdaten innerhalb einer Region und dem Kopieren von OCI File Storage-Daten in OCI Object Storage.
| Daten migrieren von | Daten migrieren zu | Empfohlene Werkzeuge | Hinweise: | Dokumentation/Tutorial-Links |
|---|---|---|---|---|
| On-Premise-Dateisystem | OCI Object Storage | 1. s5cmd (kleine/gemischte Dateien) 2. OCI Object Storage Sync (wenige große Dateien) 3. Rclone (gemischt) 4. Resilio ist überall aktiv |
Nutzen Sie das Tool am besten für Ihre Datenstrukturen und Sie fühlen sich wohl dabei. FastConnect muss überprüft werden, um die Übertragungszeit zu verbessern. | S5cmd and Object Storage Sync Tutorial, Tutorial klonen, Resilio Active Anywhere |
| Ein anderes Cloud Vendor Object oder Blob Storage | OCI Object Storage | 1. I/O flexibel gestalten 2. Rclone |
Verwenden Sie Flexify IO für kompatible S3-Anbieter und wenn eine unterstützte GUI-Schnittstelle gewünscht wird. Verwenden Sie Rclone, wenn Sie mit dem Experimentieren und Umschalten verschiedener Einstellungen vertraut sind und wenn Sie mehr als 70 verschiedene Cloud-Anbieter unterstützen (S3-kompatibler und nicht-S3-kompatibler Objektspeicher). |
I/O-Migration zwischen Clouds flexibel gestalten, Tutorial klonen |
| OCI Object Storage | OCI Object Storage in einer anderen Region | 1. Objektreplikation 2. OCI Object Storage - Bulkkopier-Python-API 3. I/O flexibel gestalten 4. Rclone |
Die Verwendung der nativen Objektreplikation eignet sich für ein genaues Replikat eines neuen Buckets, der derzeit leer ist. Verwenden Sie OCI Object Storage Bulk Copy Python API, Flexify IO oder Rclone, um Kopien eines Quell-Buckets zu initialisieren, der bereits Objekte enthält, oder wenn Sie Objekte auf dem Ziel beibehalten möchten. | Dokumentation zur Object Storage-Replikation, Oracle Cloud Infrastructure Object Storage Python-Utilitys für Bulkvorgänge verwenden, Flexify IO, Tutorial zu Klonen |
| OCI Object Storage | OCI Object Storage in einem anderen Mandanten (dieselbe oder andere Region) | 1. OCI Object Storage - Bulkkopier-Python-API 2. Flexify IO 3. Rclone |
Voraussetzung für OCI Object Storage Bulk Copy-Python-API: Mandantenübergreifende IAM-Policys verwenden, um mandantenübergreifende Kopien zu aktivieren. Weitere Informationen finden Sie unter Auf Objektspeicherressourcen mandantenübergreifend zugreifen. | Oracle Cloud Infrastructure Object Storage Python-Utilitys für Bulkvorgänge verwenden, Flexify IO, Tutorial zu Klonen |
| OCI File Storage | OCI Object Storage | 1. s5cmd (kleine/gemischte Dateien) 2. Object Storage Sync (einige große Dateien) 3. Rclone (gemischt) 4. Resilio ist überall aktiv |
Nutzen Sie das Tool am besten für Ihre Datenstrukturen und Sie fühlen sich wohl dabei. | S5cmd and Object Storage Sync Tutorial, Tutorial klonen, Resilio Active Anywhere |
| On-Premise-Dateisystem | OCI File Storage | 1. fpsync (Linux) und CIFS + fpsync (Windows) 2. Resilio ist überall aktiv |
Stellen Sie sicher, dass die Netzwerkkonnektivität zwischen Quell- und Zielinstanzen hergestellt ist. | Fpsync-Dokumentation, Fpsync-Tutorial, Resilio Active Anywhere |
| Ein anderer lokaler Datenträger oder Dateispeicher eines Cloud-Anbieters | OCI File Storage | 1. fpsync (Linux) und CIFS + fpsync (Windows) 2. Resilio ist überall aktiv |
Stellen Sie sicher, dass die Netzwerkkonnektivität zwischen Quell- und Zielinstanzen hergestellt ist. FastConnect muss überprüft werden, um die Übertragungszeit zu verbessern. | Fpsync-Dokumentation, Fpsync-Tutorial, Resilio Active Anywhere |
| OCI File Storage | OCI File Storage in einer anderen Region | 1. Dateisystemreplikation 2. fpsync mit Instanz-zu-Instanz-Streaming 3. Resilio ist überall aktiv |
Wenn Sie die Replikation verwenden, lesen Sie die Einschränkungen und Überlegungen der Replikation, oder wenn Sie Instanz-zu-Instanz-Streaming verwenden, stellen Sie sicher, dass die Netzwerkkonnektivität zwischen Quell- und Zielinstanzen hergestellt wird. | Fpsync-Dokumentation, Fpsync-Tutorial, Dokumentation zur Dateisystemreplikation, Resilio Active Anywhere |
| OCI File Storage | OCI File Storage innerhalb derselben Availability-Domain | 1. Dateisystemreplikation 2. Parallele File Storage-Tools verwenden: parcp 3. Resilio ist überall aktiv |
Wenn Sie die Replikation verwenden, lesen Sie die Einschränkungen und Überlegungen der Replikation. Wenn Sie Parcp verwenden, stellen Sie sicher, dass Quell- und Zieldateisysteme in der Instanz gemountet sind. | Dateisystemreplikation, Parallele File Storage-Tools verwenden: parcp, Resilio Active Anywhere |
| On-Premises, ein weiterer Cloud-Anbieter | OCI Object Storage oder OCI File Storage | Resilio Active Anywhere-Plattform | Verwenden Sie die Resilio Active Anywhere-Plattform, wenn Sie mehrseitige Synchronisierung von Daten, White-Glove-Service mit Support und GUI-Schnittstelle benötigen. Resilio wurde vom OCI Cloud Storage Service-Produktteam geprüft und ist im Oracle Cloud Marketplace verfügbar. | Weitere Informationen zur Verwendung ihrer Plattform erhalten Sie beim Resilio-Team. |
Hinweis: Die Migrationstoolserie deckt weder OCI Object Storage noch OCI File System Replication, OCI Object Storage Bulk Copy Python API noch Flexify und Resilio ab. Weitere Informationen finden Sie unter "Zugehörige Links".
Nächste Schritte
Fahren Sie mit den zugehörigen Tutorials fort, die für Ihre Migrationsanforderungen relevant sind. So verschieben Sie Daten in OCI Cloud-Speicherservices:
-
Informationen zum Verwenden von Rclone finden Sie in Tutorial 2: Daten mit Rclone in OCI Cloud Storage Services verschieben.
-
Informationen zur Verwendung von OCI Object Storage Sync und S5cmd finden Sie in Tutorial 3: Daten mit OCI Object Storage Sync und S5cmd in OCI Cloud Storage Services verschieben.:w
-
Informationen zur Verwendung von Fpsync und Rsync für Dateisystemdatenmigrationen finden Sie in Tutorial 4: Daten mit Fpsync und Rsync für Dateisystemdatenmigrationen in OCI Cloud Storage Services verschieben.
(Optional) Testumgebungen
Die Empfehlungen basieren auf Tests und Kundeninteraktionen.
Testumgebung 1:
1 VM-Instanz VM.Standard.E4.Flex, 1 OCPU, 1Gbps Netzwerkbandbreite, 16 GB Arbeitsspeicher. Um die Migration von On Premise zu OCI zu simulieren, wurden kopierte Daten von PHX NFS zu IAD kopiert.
Datasets
- Dataset 1: Daten aus NFS-gemountetem Dateisystem in OCI Object Storage migrieren.
Gesamtgröße des Datensatzes: 3 TB, mit 3 Dateien, jede Datei 1 TB.
| Methode | Von | Time | Befehl | Flags |
|---|---|---|---|---|
| os Sync | NFS/Datei von PHX zu Objekt-IAD | 123m17.102s | - | --parallel-operations-count 100 |
| s5cmd | NFS/Datei von PHX zu Objekt-IAD | 239m20.625s | Kopieren | run commands.txt, Standardausführung --numworkers 256 |
| rclone | NFS/Datei von PHX zu Objekt-IAD | 178m27.101s | Kopieren | --transfers=100 --oos-no-check-bucket --fast-list --checkers 64 --retries 2 --no-check-dest |
Hinweis: In unseren Tests wurde gezeigt, dass
os syncam schnellsten für dieses Dataset ausgeführt wird.
- Dataset 2: Daten aus NFS-gemountetem Dateisystem in OCI Object Storage migrieren
Gesamtgröße des Datasets: 9.787GB, mit 20.000 Dateien, jede Datei 20 MB
| Methode | Von | Time | Befehl | Flags |
|---|---|---|---|---|
| s5cmd | NFS/Datei von PHX zu Objekt-IAD | 1m12.746s | Kopieren | Standardausführung --numworkers 256 |
| os Sync | NFS/Datei von PHX zu Objekt-IAD | 2m48.742s | - | --parallel-operations-count 1000 |
| rclone | NFS/Datei von PHX zu Objekt-IAD | 1m52.886s | Kopieren | --transfers=500 --oos-no-check-bucket --no-check-dest |
Hinweis: In unseren Tests wurde gezeigt, dass
s5cmddie beste Leistung für dieses Dataset erzielt.
Testumgebung 2:
VM-Instanzen: Für jeden Test wurden 2 VM-Instanzen verwendet. Wir verwendeten eine VM.Standard.E4.Flex mit 24 OCPU, 24Gbps Netzwerkbandbreite und 384 GB Arbeitsspeicher. Oracle Linux 8 wurde für Linux-Tests verwendet. Flexify IO verwendet keine VM-Instanzen.
Beim Testen verwendete Datasets: 14 Hauptverzeichnisse mit der folgenden Dateianzahl und -größe, insgesamt 2.25TiB.
| Dataset-Verzeichnis | Schriftgrad | Anzahl Dateien | Größe jeder Datei |
|---|---|---|---|
| Verzeichnis 1 | 107.658 GiB | 110.242 | 1 MiB |
| Verzeichnis 2 | 1.687 GiB | 110.569 | 15 MiB |
| Verzeichnis 3 | 222 GiB | 111 | 2 GiB |
| Verzeichnis 4 | 1.265 TiB | 1.295 | 1 GiB |
| Verzeichnis 5 | 26.359 GiB | 1.687 | 16 MiB |
| Verzeichnis 6 | 105.281 MiB | 26.952 | 4 KiB |
| Verzeichnis 7 | 29.697 MiB | 30.410 | 1 KiB |
| Verzeichnis 8 | 83.124 GiB | 340.488 | 256 KiB |
| Verzeichnis 9 | 21.662 GiB | 354.909 | 64 KiB |
| Verzeichnis 10 | 142.629 GiB | 36.514 | 4 MiB |
| Verzeichnis 11 | 452.328 MiB | 57.898 | 8 MiB |
| Verzeichnis 12 | 144 GiB | 72 | 2GiB |
| Verzeichnis 13 | 208.500 GiB | 834 | 256 MiB |
| Verzeichnis 14 | 54.688 GiB | 875 | 64 MiB |
Hinweis:
- Die 14 Verzeichnisse wurden gegebenenfalls auf die 2 VM-Instanzen aufgeteilt.
- Jede VM führte 7 Befehle/Prozesse aus, 1 für jedes Verzeichnis, sofern nicht anders angegeben.
| Methode | Von | Time | Befehl | Kennzeichen/Notizen |
|---|---|---|---|---|
| s5cmd | NFS/Datei von PHX zu Objekt-IAD | 54m41.814s | Kopieren | --numworkers 74 |
| os Sync | NFS/Datei von PHX zu Objekt-IAD | 65m43.200s | - | --parallel-operations-count 50 |
| rclone | NFS/Datei von PHX zu Objekt-IAD | 111m59.704s | Kopieren | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 50 |
| rclone | Objekt-PHX zu Objekt-IAD | 28m55.663s | Kopieren | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 400, derselbe Befehl wird über 2 VMs ausgeführt, um 800 Übertragungen gleichzeitig auszuführen |
| python-Massenkopierskript | Objekt-PHX zu Objekt-IAD | 25m43.715s | Standard | 1 VM, 50 Worker, 100.000 Dateien in der Warteschlange |
| I/O flexibilisieren | Objekt-PHX zu Objekt-IAD | 20m27s | Kopieren | Standard ist 10 Engines/Slots |
| I/O flexibilisieren | Objekt-PHX zu Objekt-IAD | 16m12s | Kopieren | 20 Motoren/Steckplätze, dies kann über "Erweiterte Einstellungen" angehoben werden |
Die Befehle s5cmd und os sync reichen vom Dateisystem/NFS bis zum Objektspeicher. Flexify IO- und Bulk Copy-Skript konzentriert sich nur auf Object Storage-(Bucket-zu-Bucket-)Übertragungen und wurde nicht für die NFS-Migration getestet.
Nur Flexify IO,rclone und das python-Bulkkopieskript können regionsübergreifende Bucket-to-Bucket-Übertragungen ausführen, sodass die anderen Tools nicht dafür getestet wurden. Flexify IO eignet sich am besten für regionsübergreifende Objektspeichermigrationen. Das python-Bulkkopierskript funktioniert besser als rclone. Es ist wichtig zu beachten, dass Flexify IO für den mit S3 kompatiblen Objektspeicher funktioniert, das python-Bulkkopierskript nur mit OCI Object Storage funktioniert und rclone viele Backends und Cloud-Provider unterstützt.
Kleine Testläufe wurden mit rclone durchgeführt, um Daten aus Microsoft Azure Blob Storage, Amazon Simple Storage Service (Amazon S3) und Google Cloud Platform Cloud Storage an OCI Object Storage zu übertragen, um zu überprüfen, ob das Tool für diese Übertragungstypen funktioniert. Weitere Informationen finden Sie unter Daten mit Rclone in den Objektspeicher in der Cloud verschieben.
FlexifyIO wurde verwendet, um dieses Dataset von AWS us-east-2 in die OCI Ashburn-Region zu migrieren. Für die 2.25TiB wurde nur 23m51s verwendet, wobei der Standardwert von 10 Engines/Slots verwendet wurde. Für eine schnellere Performance konnten zusätzliche Engines/Slots hinzugefügt werden.
Testumgebung 3:
VM-Instanzen: Für jeden Test wurden 1-2 VM-Instanzen verwendet. Wir verwendeten eine VM.Standard.E4.Flex mit 24 OCPU, 24Gbps Netzwerkbandbreite und 384 GB Arbeitsspeicher. Oracle Linux 8 wurde für Linux-Tests verwendet. Alle Tests waren Bucket-to-Bucket. Flexify IO verwendet keine VM-Instanzen.
| Gesamte Größe | Anzahl Dateien | Dateigrößenbereich |
|---|---|---|
| 7.74 TiB | 1.000.000 | 30 MiB |
| Methode | Von | Time | Befehl | Flags | Hinweise: | |
|---|---|---|---|---|---|---|
| rclone | Object-to-Object-IAD -> IAD | 18h39m11.4s | Kopieren | --oos-no-check-bucket --fast-list --no-traverse --transfers 500 --oos-chunk-size 10Mi |
1 VM, sehr langsam aufgrund der hohen Anzahl von Dateien und der Auflistung von Quellaufrufen | |
| rclone | Object-to-Object-IAD -> IAD | 55m8.431s | Kopieren | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
2 VMs, 500 Übertragungen pro VM, Objekt-/Dateiliste mit jeweils 1.000 Dateien, verhindert die Auflistung auf Quelle und Ziel und verbessert die Performance | |
| python-Massenkopierskript | Object-to-Object-IAD -> IAD | 28m21.013s | - | Standard | 1 VM, 50 Worker, 100.000 Dateien in der Warteschlange | |
| python-Massenkopierskript | Object-to-Object-IAD -> IAD | - | - | Standard | 2 VMs, 50 Worker pro VM, 100.000 Dateien in der Warteschlange 429 Fehler empfangen, Skript hängt und konnte nicht abgeschlossen werden | |
| I/O flexibilisieren | Object-to-Object-IAD -> IAD | 39m19s | Kopieren | Standard | Standard ist 10 Engines/Slots | |
| I/O flexibilisieren | Object-to-Object-IAD -> IAD | 21m37s | Kopieren | 20 Motoren/ Schlitze | Auf 20 Motoren/Steckplätze eingestellt, kann dies über "Erweiterte Einstellungen" angehoben werden | |
| s5cmd | Object-to-Object-IAD -> IAD | 14m10.864s | Kopieren | Standardwerte (256 Mitarbeiter) | 1 VM | - |
| s5cmd | Object-to-Object-IAD -> IAD | 7m50.013s | Kopieren | Standardwerte | 2 VMs, 256 Mitarbeiter pro VM | Ran in der Hälfte der Zeit als 1 VM |
| s5cmd | Object-to-Object-IAD -> IAD | 3m23.382s | Kopieren | --numworkers 1000 |
1 VM, 1000 Mitarbeiter | Bei mehreren Tests wurde festgestellt, dass dies die optimale Ausführung für dieses Dataset mit der s5cmd war |
| rclone | Object-to-Object-IAD -> PHX | 184m36.536s | Kopieren | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
2 VMs, 500 Übertragungen pro VM, Objekt-/Dateiliste mit jeweils 1.000 Dateien | |
| python-Massenkopierskript | Object-to-Object-IAD -> PHX | 35m31.633s | - | Standard | 1VM, 50 Mitarbeiter, 100.000 Dateien gleichzeitig in der Warteschlange | |
| I/O flexibilisieren | Object-to-Object-IAD -> PHX | 21m17s | Kopieren | 20 Motoren/ Schlitze | Auf 20 Motoren/Steckplätze eingestellt, kann dies über "Erweiterte Einstellungen" angehoben werden |
Der Befehl s5cmd wurde konsistent am besten für die große Anzahl von Dateien und kleine Dateien ausgeführt. Die s5cmd ist begrenzt, weil sie nur Bucket-zu-Bucket-Kopien innerhalb desselben Mandanten und derselben Region ausführen kann.
Flexify IO wäre das empfohlene Tool für dieses Migrations-Dataset, da es eine gute Performance bietet und verschiedene S3-kompatible Objektspeichertypen unterstützt. Die Migrationszeit ist nach dem Anheben der Engine-/Slotanzahl für Flexify IO gesunken.
Beachten Sie hohe Verbesserungen an rclone, sobald Dateien an den Befehl und von der Skalierung auf eine andere VM eingespeist werden. Rclone läuft möglicherweise langsamer als andere Tools, ist jedoch die vielseitigste in den verschiedenen Plattformen, die es unterstützt, und Arten von Migrationen, die es durchführen kann.
Die OCI Object Storage Bulk Copy-Python-API kann nur die OCI Native CopyObject-API verwenden und kann nur bis zu einer Nebenläufigkeit von 50 Mitarbeitern erreichen, bevor sie gedrosselt wird. Im Allgemeinen funktioniert sie für dieses Dataset ziemlich gut.
Tests für IAD zu PHX wurden nur an dem durchgeführt, was am besten in IAD zu IAD funktionierte, und problematische Tests wurden nicht erneut ausgeführt. Die s5cmd wurde nicht für IAD in PHX ausgeführt, weil sie nur Bucket-zu-Buckets-Kopien innerhalb derselben Region ausführen kann.
Verwandte Links
-
Migrationsgrundlagen für das Verschieben von Daten in OCI Cloud Storage
-
Tutorial 2: Daten mit Rclone in OCI Cloud Storage Services verschieben
-
Tutorial 3: Daten mit OCI Object Storage Sync und S5cmd in OCI Cloud Storage Services verschieben
-
Daten mit Rclone in Objektspeicherung in der Cloud verschieben
-
Ankündigung der Backend-Unterstützung des nativen OCI Object Storage-Providers in rclone
-
Datenmigration zu und zwischen OCI-Speicherservices mit Resilio Connect
-
Oracle Cloud Infrastructure Object Storage Python-Utilitys für Bulkvorgänge verwenden
Bestätigungen
-
Autoren – Vinoth Krishnamurthy (Principal Member of Technical Staff, OCI File Storage), Melinda Centeno (Senior Principal Product Manager, OCI Object Storage)
-
Mitwirkende – Aboo Valappil (Consulting Member of Technical Staff, OCI File and Block Storage), Ashutosh Mate (Senior Principal Product Manager, OCI Object Storage)
Weitere Lernressourcen
Sehen Sie sich weitere Übungen zu docs.oracle.com/learn an, oder greifen Sie auf weitere kostenlose Lerninhalte im Oracle Learning YouTube-Kanal zu. Besuchen Sie außerdem education.oracle.com/learning-explorer, um ein Oracle Learning Explorer zu werden.
Die Produktdokumentation finden Sie im Oracle Help Center.
Use Migration Tools to Move Data into OCI Cloud Storage Services
G25551-02