Utiliser les outils de migration pour déplacer des données vers les services de stockage cloud OCI
Introduction
Ce tutoriel 1 d'une série de quatre tutoriels présente différentes façons de migrer des données vers les services de stockage cloud Oracle Cloud Infrastructure (OCI). La série est configurée afin que vous puissiez consulter ce premier tutoriel pour obtenir une compréhension générale des différents outils, puis passer aux tutoriels ou documents connexes pertinents pour vos besoins de migration.
OCI fournit aux clients des options de calcul hautes performances et de stockage cloud à faible coût. Grâce au stockage local, d'objets, de fichiers, de blocs et d'archives à la demande, Oracle répond aux principaux besoins et cas d'emploi en matière de charge de travail de stockage.
Les services de stockage cloud OCI offrent des options de stockage cloud rapides, sécurisées et durables pour tous les besoins de votre entreprise. En commençant par les options hautes performances telles qu'OCI File Storage with Lustre et le service OCI Block Volumes ; les systèmes de fichiers à l'échelle exaoctet entièrement gérés à partir du service OCI File Storage avec des cibles de montage hautes performances ; vers OCI Object Storage hautement durable et évolutif. Nos solutions peuvent répondre à vos demandes, allant des applications exigeantes en performances telles que les charges de travail d'IA/ML aux lacs de données à l'échelle de l'exaoctet.
De nombreux clients ont besoin de transférer des données vers le service de stockage cloud OCI à partir d'un site, d'un autre fournisseur ou entre les services de stockage cloud OCI. En fonction de l'origine, de la destination et de la direction du transfert de données, la meilleure méthode pour effectuer la migration peut varier. Une fois que vous avez identifié les bases de la source de données et de la destination dans OCI, vous devez décider d'un chemin de migration et des outils à utiliser. Laissez notre expérience pratique vous guider vers le bon outil de migration et comment l'utiliser. Ce tutoriel 1 d'une série vous présente les différents outils et les éléments les plus adaptés au processus de migration.
Déterminez la quantité de données à migrer et le temps d'inactivité disponible pour le basculement vers la nouvelle plate-forme de stockage OCI. Les migrations par lots sont un bon choix pour décomposer la migration en incréments gérables. Les migrations par lots vous permettront de programmer des temps d'arrêt pour des applications spécifiques dans différentes fenêtres. Certains clients ont la possibilité d'effectuer une migration ponctuelle sur une fenêtre de maintenance programmée sur 2 à 4 jours. OCI FastConnect peut être utilisé pour créer une connexion privée dédiée entre OCI et votre environnement, avec des vitesses de port de 1G à 400G pour accélérer le processus de transfert de données. OCI FastConnect peut être intégré à des solutions partenaires telles que Megaport et ConsoleConnect pour créer une connexion privée à votre centre de données ou une interconnexion cloud-cloud afin de déplacer les données plus directement d'un autre fournisseur cloud vers le service de stockage cloud OCI. Pour plus d'informations, reportez-vous à Intégration de FastConnect avec Megaport Cloud Router.
Public
DevOps ingénieurs, développeurs, administrateurs et utilisateurs du stockage cloud OCI, responsables informatiques, superutilisateurs OCI et administrateurs d'application.
Objectifs
Découvrez comment utiliser divers outils pour copier et synchroniser des données dans les services de stockage cloud OCI :
-
Identifier les outils courants de migration.
-
Découvrez les différents outils de migration des données de système de fichiers (locales, NAS, hébergées sur le cloud) vers les services de stockage cloud OCI.
-
Découvrez quel outil est le mieux adapté à différents cas d'utilisation.
Prérequis
-
Une compréhension de votre ensemble de migration de données, de la taille globale et de l'apparence des fichiers ou des objets (fichiers volumineux, petits fichiers, etc.).
-
Où dans le service de stockage cloud OCI (Object Storage, File Storage ou Block Volumes), le stockage doit atterrir.
-
Vos calendriers et si vous effectuez une migration (par lots) en masse ou incrémentielle.
Outils de migration
Notre expérience client et nos tests peuvent vous aider à déterminer l'outil de migration qui correspond le mieux à votre scénario. Nous vous encourageons à faire une preuve de concept et des tests sur des exemples d'ensembles de données afin de vérifier la meilleure méthode de migration pour votre ensemble de données. Nous explorerons les outils de migration courants disponibles pour migrer les données des fournisseurs cloud sur site et autres vers OCI ou dans les services de stockage cloud OCI. Les résultats des tests sont partagés à partir d'ensembles de données échantillon afin que vous puissiez extrapoler la façon dont les outils peuvent fonctionner sur votre ensemble de données.
-
Rclone : Rclone est un utilitaire de ligne de commande open source permettant de migrer des données vers le cloud ou entre des fournisseurs de stockage cloud. Rclone peut être utilisé pour effectuer une migration ponctuelle et une synchronisation périodique entre le stockage source et le stockage de destination. Rclone peut migrer des données vers et depuis le stockage d'objets, le stockage de fichiers, les lecteurs montés et entre 70 types de stockage pris en charge. OCI Object Storage est pris en charge de manière native en tant que fournisseur back-end Rclone. Les processus Rclone peuvent être augmentés et redimensionnés pour augmenter les performances de transfert à l'aide des options de paramètre. Rclone dispose d'options telles que la copie et la synchronisation pour transférer des données une fois et périodiques respectivement. Pour plus d'informations, reportez-vous à Installation de Rclone.
-
Flexifier les E/S : Flexify E/S est un outil de migration tiers, facile à utiliser et axé sur le stockage d'objets. Flexify fonctionne avec le cloud compatible S3 (OCI, AWS, GCP, Azure, etc.) et le stockage d'objets sur site (Minio, Dell EMC ECS, etc.). Il vous suffit de vous connecter à la gestion Flexify et de configurer les informations d'identification et de connexion/clés d'accès, puis de configurer la migration via une interface utilisateur graphique (GUI). L'algorithme de mise à l'échelle horizontale de Flexify IO évolue automatiquement aussi rapidement que la connectivité et le stockage le permettent. Flexify est également intégré à des fournisseurs Network as a Service (NaaS), tels que le partenaire OCI Megaport, et peut provisionner/déprovisionner des connexions rapides à la demande. Pour plus d'informations, consultez la migration des données entre les clouds et la solution Megaport et Flexify IO.
-
Resilio Active Anywhere : Resilio est une application de transfert de données tierce basée sur un agent. Il s'agit d'une interface utilisateur graphique (GUI) riche qui permet de contrôler les travaux de transfert et de visualiser les mesures de performances. Ce logiciel est disponible dans Oracle Cloud Marketplace et fait l'objet d'une licence Resilio pour son installation. Resilio peut synchroniser des fichiers dans des intervalles de temps fixes dans n'importe quelle direction dans un maillage un à plusieurs, plusieurs à un ou plusieurs à plusieurs, ce qui permet une présence globale dans un ensemble de données. Pour plus d'informations, reportez-vous à Migration des données vers et entre les services de stockage OCI à l'aide de Resilio Connect et de Resilio Active Anywhere.
-
Utilitaires de synchronisation Linux open source : rsync et fpsync.
-
Rsync : outil commun basé sur Unix pour effectuer une copie unique ou une synchronisation périodique entre les chemins source et de destination.
-
Fpsync : Outil open source permettant d'effectuer la synchronisation parallèle. Il utilise rsync, tar ou rclone en dessous et exécute un wrapper parallèle sur le dessus. Vous pouvez choisir rsync, tar ou rclone comme outil de synchronisation sous-jacent.
-
-
Utilisation des outils parallèles de stockage de fichiers : OCI File Storage a fourni un package d'outils parallèles qui fonctionne de manière optimale avec le système de fichiers. Il est disponible avec le référentiel de développeurs Linux et peut être installé directement à partir du référentiel yum. Le paquet contient trois outils qui sont parcp, parter et param qui sont l'équivalent parallèle des utilitaires Linux standard cp, tar et rm respectivement.
-
Synchronisation Object Storage de l'interface de ligne de commande OCI : OCI Object Storage Sync (synchronisation OSO) fait partie de l'interface de ligne de commande OCI qui synchronise un répertoire de système de fichiers avec les objets d'un bucket. La commande parcourt les sous-répertoires en copiant les fichiers ou objets nouveaux et modifiés de la source vers la destination et en supprimant éventuellement ceux qui ne sont pas présents dans la source. Il peut exécuter jusqu'à 1 00 opérations en parallèle, selon les ressources de la machine hôte.
-
API Python de copie en masse OCI Object Storage : le lien suivant est un exemple de script de copie en masse utilisant l'API python pour OCI. L'API peut être utilisée pour écrire des scripts tels que l'exemple de script qui utilise des threads parallèles pour copier des objets d'un bucket vers un autre. Pour plus d'informations sur l'utilisation de l'exemple de script, reportez-vous à Utilisation des utilitaires Python Oracle Cloud Infrastructure Object Storage pour les opérations en masse.
-
Outil compatible S3 (s5cmd) : s5cmd est un outil open source qui peut être utilisé pour migrer ou synchroniser les systèmes de fichiers locaux et le stockage NAS (sur site et dans OCI) vers OCI Object Storage. Elle peut également être utilisée pour migrer un bucket de données dans la même région.
Le bon outil pour le travail
Il existe de nombreux outils à choisir lors d'une migration, et il peut être écrasant de les rechercher tous en même temps. En fonction de l'origine, de la destination, de la direction de la migration, de l'expérience utilisateur et de l'environnement utilisateur, le meilleur outil de migration variera.
Le tableau suivant fournit des recommandations pour les scénarios de migration courants, notamment la migration des données sur site, la migration des données d'un autre fournisseur cloud vers OCI, la copie des données de stockage cloud OCI d'une région à une autre, la copie des données de stockage cloud OCI au sein d'une région et la copie des données OCI File Storage vers OCI Object Storage.
| Migrer les données depuis | Migrer les données vers | Outil(s) recommandé(s) | Remarques | Liens Documentation/Tutoriel |
|---|---|---|---|---|
| Système de fichiers on-premise | OCI Object Storage | 1. s5cmd (petits fichiers/mixtes) 2. OCI Object Storage Sync (peu de fichiers volumineux) 3. Rclone (mélangé) 4. Resilio Active partout |
Utilisez le meilleur outil pour vos structures de données et vous sentez à l'aise. FastConnect doit être examiné pour améliorer le temps de transfert. | Tutoriel S5cmd et Object Storage Sync, Tutoriel Rclone, Resilio Active Anywhere |
| Autre objet fournisseur cloud ou stockage BLOB | OCI Object Storage | 1. Flexifier les E/S 2. Rclone |
Utilisez Flexify IO pour les fournisseurs compatibles S3 et lorsqu'une interface graphique prise en charge est souhaitée. Utilisez Rclone lorsque vous êtes à l'aise d'expérimenter et de basculer entre différents paramètres et pour le support le plus compatible de plus de 70 fournisseurs de cloud différents (stockage d'objets compatible S3 et non compatible S3). |
Flexifier la migration des E/S entre les clouds, tutoriel sur le clonage |
| OCI Object Storage | OCI Object Storage dans une autre région | 1. Réplication d'objets 2. API Python de copie en masse d'OCI Object Storage 3. Flexifier les E/S 4. Rclone |
L'utilisation de la réplication d'objet native est idéale pour une réplique exacte d'un nouveau bucket actuellement vide. Utilisez l'API Python de copie en masse OCI Object Storage, Flexify IO ou Rclone pour initialiser des copies d'un bucket source qui comporte déjà des objets ou lorsque vous souhaitez conserver des objets sur la destination. | Documentation sur la réplication Object Storage, Utilisation des utilitaires Python Oracle Cloud Infrastructure Object Storage pour les opérations en masse, Flexify IO, Tutoriel sur le clonage |
| OCI Object Storage | OCI Object Storage dans une autre location (même région ou autre) | 1. API Python de copie en masse d'OCI Object Storage 2. Flexifier les E/S 3. Rclone |
Prérequis pour l'API Python de copie en masse OCI Object Storage : utilisez des stratégies IAM inter-location pour activer les copies inter-location. Pour plus d'informations, reportez-vous à Accès aux ressources Object Storage dans les locations. | Utilisation des utilitaires Python Oracle Cloud Infrastructure Object Storage pour les opérations en masse, Flexifier les E/S, Tutoriel sur le clonage |
| OCI File Storage | OCI Object Storage | 1. s5cmd (petits fichiers/mixtes) 2. Object Storage Sync (peu de fichiers volumineux) 3. Rclone (mélangé) 4. Resilio Active partout |
Utilisez le meilleur outil pour vos structures de données et vous sentez à l'aise. | Tutoriel S5cmd et Object Storage Sync, Tutoriel Rclone, Resilio Active Anywhere |
| Système de fichiers on-premise | OCI File Storage | 1. fpsync (Linux) et CIFS + fpsync (Windows) 2. Resilio Active partout |
Assurez-vous que la connectivité réseau est établie entre les instances source et de destination. | Documentation Fpsync, Tutoriel fpsync, Resilio Active Anywhere |
| Disque local ou stockage de fichiers d'un autre fournisseur cloud | OCI File Storage | 1. fpsync (Linux) et CIFS + fpsync (Windows) 2. Resilio Active partout |
Assurez-vous que la connectivité réseau est établie entre les instances source et de destination. FastConnect doit être examiné pour améliorer le temps de transfert. | Documentation Fpsync, Tutoriel fpsync, Resilio Active Anywhere |
| OCI File Storage | OCI File Storage dans une autre région | 1. Réplication de système de fichiers 2. fpsync avec transmission en continu d'instance à instance 3. Resilio Active partout |
Si vous utilisez la réplication, reportez-vous aux limites et remarques de la réplication ou si vous utilisez la transmission en continu d'instance à instance, assurez-vous que la connectivité réseau est établie entre les instances source et de destination. | Documentation Fpsync, Tutoriel fpsync, Documentation sur la réplication du système de fichiers, Resilio Active Anywhere |
| OCI File Storage | OCI File Storage dans le même domaine de disponibilité | 1. Réplication du système de fichiers 2. Utilisation des outils de fichier parallèles pour File Storage : parcp 3. Resilio Active partout |
Si vous utilisez la réplication, reportez-vous aux limites et remarques de la réplication ou si vous utilisez parcp, assurez-vous que les systèmes de fichiers source et de destination sont montés dans l'instance. | Réplication de système de fichiers, Utilisation des outils parallèles File Storage : parcp, Resilio Active Anywhere |
| Sur site, un autre fournisseur cloud | OCI Object Storage ou OCI File Storage | Plateforme Resilio Active Anywhere | Utilisez la plate-forme Resilio Active Anywhere lorsque vous avez besoin d'une synchronisation multidirectionnelle des données, d'un service de gant blanc avec prise en charge et d'une interface graphique. Resilio a été vérifié par l'équipe produit du service de stockage cloud OCI et est disponible sur Oracle Cloud Marketplace. | Pour plus d'informations sur l'utilisation de leur plate-forme, contactez l'équipe Resilio. |
Remarque : la série d'outils de migration ne couvre pas OCI Object Storage ou OCI File System Replication, OCI Object Storage Bulk Copy Python API, Flexify et Resilio. Pour plus d'informations, reportez-vous aux liens connexes.
Etapes suivantes
Passez aux tutoriels connexes correspondant à vos besoins en matière de migration. Pour déplacer des données vers les services de stockage cloud OCI, procédez comme suit :
-
A l'aide de Rclone, reportez-vous au tutoriel 2 : Déplacement de données vers les services de stockage cloud OCI à l'aide de Rclone.
-
A l'aide d'OCI Object Storage Sync et de S5cmd, reportez-vous au tutoriel 3 : Déplacement de données vers les services OCI Cloud Storage à l'aide d'OCI Object Storage Sync et à S5cmd.
-
A l'aide de Fpsync et de Rsync pour les migrations de données de système de fichiers, reportez-vous à Tutoriel 4 : Déplacement de données vers OCI Cloud Storage Services à l'aide de Fpsync et de Rsync pour les migrations de données de système de fichiers.
(Facultatif) Environnements de test
Les recommandations sont basées sur les tests et les interactions avec les clients.
Environnement de test 1:
1 instance de machine virtuelle VM.Standard.E4.Flex, 1 OCPU, 1Gbps bande passante réseau, 16 Go de mémoire. Pour simuler une migration sur site vers OCI, les données ont été copiées de PHX NFS vers IAD.
Ensembles de données
- Ensemble de données 1 : migration des données du système de fichiers monté NFS vers OCI Object Storage.
Taille totale de l'ensemble de données : 3 To, avec 3 fichiers, chaque fichier 1 To.
| Méthode | De | Temps | Commande | Indicateurs |
|---|---|---|---|---|
| synchronisation os | NFS/File PHX vers Object IAD | 123m17.102s | S/O | --parallel-operations-count 100 |
| s5cmd | NFS/File PHX vers Object IAD | 239m20.625s | copier | run commands.txt, exécution par défaut --numworkers 256 |
| rclone | NFS/File PHX vers Object IAD | 178m27.101s | copier | --transfers=100 --oos-no-check-bucket --fast-list --checkers 64 --retries 2 --no-check-dest |
Remarque : nos tests ont montré que
os syncfonctionnait le plus rapidement pour cet ensemble de données.
- Ensemble de données 2 : migration des données du système de fichiers monté NFS vers OCI Object Storage
Taille totale de l'ensemble de données : 9.787GB, avec 20 000 fichiers, chaque fichier 20 Mo
| Méthode | De | Temps | Commande | Indicateurs |
|---|---|---|---|---|
| s5cmd | NFS/File PHX vers Object IAD | 1m12.746s | copier | exécution par défaut --numworkers 256 |
| synchronisation os | NFS/File PHX vers Object IAD | 2m48.742s | S/O | --parallel-operations-count 1000 |
| rclone | NFS/File PHX vers Object IAD | 1m52.886s | copier | --transfers=500 --oos-no-check-bucket --no-check-dest |
Remarque : nos tests ont montré que
s5cmdétait le plus performant pour cet ensemble de données.
Environnement de test 2:
Instances de machine virtuelle : 2 instances de machine virtuelle ont été utilisées pour chaque test. Nous avons utilisé une valeur VM.Standard.E4.Flex avec 24 OCPU, 24Gbps bande passante réseau, 384 Go de mémoire. Oracle Linux 8 a été utilisé pour les tests Linux. L'E/S Flexify n'utilise pas les instances de machine virtuelle.
Jeux de données utilisés dans le test : 14 répertoires principaux avec le nombre et les tailles de fichier suivants, totalisant 2.25TiB.
| Répertoire du jeu de données | Taille | Nombre de fichiers | Taille de chaque fichier |
|---|---|---|---|
| Répertoire 1 | 107.658 Gio | 110 242 | 1 Mio |
| Répertoire 2 | 1.687 Gio | 110 569 | 15 Mio |
| Répertoire 3 | 222 Gio | 111 | 2 Gio |
| Répertoire 4 | 1.265 Tio | 1 295 | 1 Gio |
| Répertoire 5 | 26.359 Gio | 1 687 | 16 Mio |
| Répertoire 6 | 105.281 Mio | 26 952 | 4 kio |
| Répertoire 7 | 29.697 Mio | 30 410 | 1 kio |
| Répertoire 8 | 83.124 Gio | 340 488 | 256 kio |
| Répertoire 9 | 21.662 Gio | 354 909 | 64 kio |
| Répertoire 10 | 142.629 Gio | 36 514 | 4 Mio |
| Répertoire 11 | 452.328 Mio | 57 898 | 8 Mio |
| Répertoire 12 | 144 Gio | 72 | 2Gio |
| Répertoire 13 | 208.500 Gio | 834 | 256 Mio |
| Répertoire 14 | 54.688 Gio | 875 | 64 Mio |
Remarque :
- Les 14 répertoires ont été répartis entre les 2 instances de machine virtuelle, le cas échéant.
- Chaque machine virtuelle a exécuté 7 commandes/processus, 1 pour chaque répertoire, sauf indication contraire.
| Méthode | De | Temps | Commande | Indicateurs/Notes |
|---|---|---|---|---|
| s5cmd | NFS/File PHX vers Object IAD | 54m41.814s | copier | --numworkers 74 |
| synchronisation os | NFS/File PHX vers Object IAD | 65m43.200s | S/O | --parallel-operations-count 50 |
| rclone | NFS/File PHX vers Object IAD | 111m59.704s | copier | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 50 |
| rclone | Objet PHX vers objet IAD | 28m55.663s | copier | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 400, même commande exécutée sur 2 machines virtuelles pour une simultanéité de 800 transferts |
| Script de copie en masse python | Objet PHX vers objet IAD | 25m43.715s | Par défaut | 1 machine virtuelle, 50 salariés, 100 000 fichiers mis en file d'attente à la fois |
| Flexibilité des E/S | Objet PHX vers objet IAD | 20m27s | copier | Valeur par défaut : 10 moteurs/emplacements |
| Flexibilité des E/S | Objet PHX vers objet IAD | 16m12s | copier | 20 moteurs / emplacements, cela peut être relevé via "Paramètres avancés" |
Les commandes s5cmd et os sync fonctionnent bien sur le système de fichiers/NFS vers le stockage d'objets. Le script d'E/S flexible et de copie en masse se concentre uniquement sur les transferts de stockage d'objets (de bucket à bucket) et n'a pas été testé pour la migration NFS.
Seuls Flexify IO,rclone et le script de copie en masse python sont capables d'effectuer des transferts de bucket à bucket entre les régions, de sorte que les autres outils n'ont pas été testés pour cela. Flexify IO offre les meilleures performances pour les migrations de stockage d'objets entre les régions. Le script de copie en masse python s'exécute mieux que rclone. Il est important de noter que Flexify IO fonctionne pour le stockage d'objets compatible S3, que le script de copie en masse python fonctionne uniquement avec OCI Object Storage et que rclone prend en charge de nombreux back-ends et fournisseurs cloud.
De petites exécutions de test ont été effectuées à l'aide de rclone pour transférer des données de Microsoft Azure Blob Storage, d'Amazon Simple Storage Service (Amazon S3) et de Google Cloud Platform Cloud Storage vers OCI Object Storage afin de vérifier que l'outil fonctionne pour ces types de transfert. Pour plus d'informations, reportez-vous à Déplacement de données vers le stockage d'objets dans le cloud en utilisant Rclone.
FlexifyIO a été utilisé pour migrer cet ensemble de données d'AWS us-east-2 vers la région OCI Ashburn et n'a utilisé que 23m51s pour 2.25TiB à l'aide de la valeur par défaut de 10 moteurs/emplacements. Des moteurs/emplacements supplémentaires ont pu être ajoutés pour des performances plus rapides.
Environnement de test 3:
Instances de machine virtuelle : 1 à 2 instances de machine virtuelle ont été utilisées pour chaque test. Nous avons utilisé une valeur VM.Standard.E4.Flex avec 24 OCPU, 24Gbps bande passante réseau et 384 Go de mémoire. Oracle Linux 8 a été utilisé pour les tests Linux. Tous les tests étaient bucket-to-bucket. L'E/S Flexify n'utilise pas les instances de machine virtuelle.
| Taille totale | Nombre de fichiers | Plage de tailles de fichier |
|---|---|---|
| 7.74 Tio | 1 000 000 | 30 Mio |
| Méthode | De | Temps | Commande | Indicateurs | Remarques | |
|---|---|---|---|---|---|---|
| rclone | Objet IAD -> Objet IAD | 18h39m11.4s | copier | --oos-no-check-bucket --fast-list --no-traverse --transfers 500 --oos-chunk-size 10Mi |
1 machine virtuelle, très lente en raison du nombre élevé de fichiers et de la liste des appels à la source | |
| rclone | Objet IAD -> Objet IAD | 55m8.431s | copier | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
2 machines virtuelles, 500 transferts par machine virtuelle, liste d'objets/fichiers alimentés en 1 000 fichiers à la fois, empêche l'établissement de listes sur la source et la destination et améliore les performances | |
| Script de copie en masse python | Objet IAD -> Objet IAD | 28m21.013s | S/O | Par défaut | 1 machine virtuelle, 50 salariés, 100 000 fichiers mis en file d'attente à la fois | |
| Script de copie en masse python | Objet IAD -> Objet IAD | S/O | S/O | Par défaut | 2 machines virtuelles, 50 processus par machine virtuelle, 100 000 fichiers mis en file d'attente à la fois. 429 erreurs reçues, script bloqué et impossible de terminer | |
| Flexibilité des E/S | Objet IAD -> Objet IAD | 39m19s | copier | Par défaut | Valeur par défaut : 10 moteurs/emplacements | |
| Flexibilité des E/S | Objet IAD -> Objet IAD | 21m37s | copier | 20 moteurs/emplacements | Défini sur 20 moteurs/emplacements, cela peut être relevé via "Paramètres avancés" | |
| s5cmd | Objet IAD -> Objet IAD | 14m10.864s | copier | Valeurs par défaut (256 salariés) | 1 machine virtuelle | S/O |
| s5cmd | Objet IAD -> Objet IAD | 7m50.013s | copier | Valeurs par défaut | 2 machines virtuelles, 256 salariés par machine virtuelle | Ran en environ la moitié du temps en tant que 1 VM |
| s5cmd | Objet IAD -> Objet IAD | 3m23.382s | copier | --numworkers 1000 |
1 machine virtuelle, 1000 processus actifs | Lors de plusieurs tests, nous avons constaté qu'il s'agissait de l'exécution optimale pour cet ensemble de données avec s5cmd |
| rclone | Objet IAD -> Objet PHX | 184m36.536s | copier | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
2 machines virtuelles, 500 transferts par machine virtuelle, liste d'objets/fichiers alimentés en 1 000 fichiers à la fois | |
| Script de copie en masse python | Objet IAD -> Objet PHX | 35m31.633s | S/O | Par défaut | 1VM, 50 salariés, 100 000 fichiers mis en file d'attente à la fois | |
| Flexibilité des E/S | Objet IAD -> Objet PHX | 21m17s | copier | 20 moteurs/emplacements | Défini sur 20 moteurs/emplacements, cela peut être relevé via "Paramètres avancés" |
La commande s5cmd s'est exécutée de manière optimale pour le nombre de fichiers volumineux et les petits fichiers. s5cmd est limité car il peut uniquement effectuer des copies de bucket à bucket au sein de la même location et de la même région.
Flexify IO est l'outil recommandé pour cet ensemble de données de migration car il fonctionne bien et prend en charge différents types de stockage d'objet compatibles S3. Temps de migration arrêté après augmentation du nombre de moteurs/d'emplacements pour les E/S Flexify.
Des améliorations importantes sont apportées à rclone une fois que les fichiers sont transmis à la commande et lors du redimensionnement vers une autre machine virtuelle. Rclone peut fonctionner plus lentement que d'autres outils, mais il est le plus polyvalent dans les différentes plates-formes qu'il prend en charge et les types de migrations qu'il peut effectuer.
L'API Python de copie en masse OCI Object Storage ne peut utiliser que l'API CopyObject native OCI et ne peut obtenir qu'une simultanéité de 50 processus avant d'être ralentie, elle fonctionne généralement assez bien pour cet ensemble de données.
Les tests pour IAD à PHX n'ont été effectués que sur ce qui fonctionnait le mieux dans IAD à IAD et les tests problématiques n'ont pas été réexécutés. s5cmd n'a pas été exécuté pour IAD vers PHX car il peut uniquement effectuer des copies de bucket à bucket dans la même région.
Liens connexes
-
Les fondamentaux de la migration pour déplacer des données vers OCI Cloud Storage
-
Tutoriel 2 : Déplacement de données vers les services de stockage cloud OCI à l'aide de Rclone
-
Déplacement de données vers le stockage d'objets dans le cloud en utilisant Rclone
-
Annonce de la prise en charge du back-end du fournisseur OCI Object Storage natif dans rclone
-
Migration des données vers et entre les services de stockage OCI à l'aide de Resilio Connect
Accusés de réception
-
Auteurs - Vinoth Krishnamurthy (membre principal du personnel technique, OCI File Storage), Melinda Centeno (chef de produit principal, OCI Object Storage)
-
Contributeurs - Aboo Valappil (membre consultant du personnel technique, OCI File et Block Storage), Ashutosh Mate (chef de produit principal principal, OCI Object Storage)
Ressources de formation supplémentaires
Explorez d'autres ateliers sur le site docs.oracle.com/learn ou accédez à d'autres contenus d'apprentissage gratuits sur le canal Oracle Learning YouTube. En outre, visitez le site education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.
Pour obtenir de la documentation sur le produit, consultez Oracle Help Center.
Use Migration Tools to Move Data into OCI Cloud Storage Services
G25554-02