Utiliser les outils de migration pour déplacer des données vers les services de stockage en nuage pour OCI
Présentation
Il s'agit du tutoriel 1 d'une série de quatre tutoriels qui vous montrent différentes façons de migrer des données vers les services de stockage en nuage d'Oracle Cloud Infrastructure (OCI). La série est configurée pour que vous puissiez consulter ce premier tutoriel afin de mieux comprendre les différents outils, puis passer aux tutoriels ou documents connexes pertinents à vos besoins de migration.
OCI offre aux clients des options de calcul haute performance et de stockage infonuagique à faible coût. Grâce au stockage sur demande local, d'objet, de fichier, de blocs et d'archives, Oracle répond aux exigences clés en matière de charge de travail de stockage et aux cas d'utilisation.
Les services de stockage en nuage OCI offrent des options de stockage en nuage rapides, sécurisées et durables pour tous vos besoins d'entreprise. En commençant par les options de haute performance telles que le service OCI File Storage with Lustre et le service OCI Block Volumes; les systèmes de fichiers à l'échelle de l'exaoctet entièrement gérés à partir du service OCI File Storage avec des cibles de montage haute performance; vers le service OCI Object Storage hautement durable et évolutif. Nos solutions peuvent répondre à vos demandes, qu'il s'agisse d'applications exigeantes en matière de performance telles que les charges de travail d'intelligence artificielle et d'apprentissage automatique, ou de lacs de données à l'échelle d'exaoctets.
De nombreux clients trouvent qu'il est nécessaire de transférer des données vers le service de stockage en nuage OCI à partir d'un emplacement sur place, d'un autre fournisseur ou entre les services de stockage en nuage OCI. En fonction de l'origine, de la destination et du sens du transfert de données, la meilleure méthode pour effectuer la migration peut varier. Une fois que vous aurez identifié les bases de la source de données et de la destination dans OCI, vous devrez décider d'un chemin de migration et des outils à utiliser. Laissez notre expérience pratique vous guider vers le bon outil de migration et comment l'utiliser. Ce tutoriel 1 d'une série pour vous présenter divers outils et où ils pourraient s'intégrer le mieux dans le processus de migration.
Déterminez la quantité de données à migrer et le temps d'arrêt disponible pour la mise en service vers la nouvelle plate-forme de stockage OCI. Les migrations par lots sont un bon choix pour diviser la migration en incréments gérables. Les migrations par lots vous permettront de programmer des temps d'arrêt pour des applications spécifiques dans différentes fenêtres. Certains clients peuvent effectuer une migration ponctuelle sur une fenêtre de maintenance programmée sur une période de 2 à 4 jours. OCI FastConnect peut être utilisé pour créer une connexion privée dédiée entre OCI et votre environnement, avec des vitesses de port de 1G à 400G pour accélérer le processus de transfert de données. OCI FastConnect peut être intégré à des solutions de partenaires telles que Megaport et ConsoleConnect pour créer une connexion privée à votre centre de données ou une interconnexion entre le nuage et le nuage afin de déplacer des données plus directement d'un autre fournisseur de services en nuage vers le service de stockage en nuage OCI. Pour plus d'informations, voir Intégration à FastConnect avec le routeur Megaport Cloud.
Public cible
ingénieurs, développeurs DevOps, administrateurs et utilisateurs du stockage en nuage OCI, gestionnaires des TI, utilisateurs expérimentés OCI et administrateurs d'applications.
Objectifs
Apprenez comment utiliser divers outils pour copier et synchroniser des données dans les services de stockage en nuage OCI :
-
Identifier les outils de migration courants.
-
Découvrez les différents outils pour migrer des données de système de fichiers (locales, NAS, hébergées dans le nuage) vers les services de stockage en nuage OCI.
-
Découvrez quel outil est le mieux adapté à divers cas d'utilisation.
Conditions requises
-
Comprendre votre jeu de migration de données, la taille globale et à quoi ressemblent les fichiers ou les objets (quelques fichiers volumineux, de nombreux petits fichiers, etc.).
-
Où dans le service de stockage en nuage OCI (stockage d'objets, stockage de fichiers ou volumes par blocs), le stockage doit atterrir.
-
Vos délais et si vous effectuez une migration en masse ou incrémentielle (par lots).
Outils de migration
Notre expérience client et nos tests peuvent vous aider à déterminer l'outil de migration le mieux adapté à votre scénario. Nous vous encourageons à effectuer une démonstration de faisabilité et des tests sur des exemples de jeux de données afin de vérifier la meilleure méthode de migration pour votre jeu de données. Nous explorerons les outils de migration courants disponibles pour migrer des données de fournisseurs sur place et d'autres fournisseurs de services en nuage vers OCI ou dans les services de stockage en nuage OCI. Les résultats des tests sont partagés à partir d'exemples de jeux de données afin que vous puissiez extrapoler les performances des outils sur votre jeu de données.
-
Rclone : Rclone est un utilitaire à code source libre de ligne de commande permettant de migrer des données vers le nuage ou entre des fournisseurs de stockage en nuage. Rclone peut être utilisé pour effectuer une migration ponctuelle ainsi qu'une synchronisation périodique entre le stockage source et le stockage de destination. Rclone peut migrer des données vers et depuis le stockage d'objets, le stockage de fichiers, les lecteurs montés et entre 70 types de stockage pris en charge. OCI Object Storage est pris en charge de manière native en tant que fournisseur dorsal Rclone. Les processus Rclone peuvent être redimensionnés pour augmenter les performances de transfert à l'aide d'options de paramètre. Rclone a des options telles que copier et synchroniser pour transférer des données ponctuelles et périodiques respectivement. Pour plus d'informations, voir Installer le clone.
-
Flexify IO (Flexifier les E/S) : Flexify IO est un outil de migration de tierce partie facile à utiliser axé sur le stockage d'objets. Flexify fonctionne avec le cloud compatible S3 (OCI, AWS, GCP, Azure et plus encore) et le stockage d'objets sur site (Minio, Dell EMC ECS et autres). Connectez-vous simplement à Flexify management (Flexifier la gestion) et configurez les données d'identification et les clés d'accès, puis configurez la migration au moyen d'une interface utilisateur graphique (GUI). L'algorithme d'ajustement horizontal de Flexify IO s'adapte automatiquement aussi rapidement que la connectivité et que le stockage le permet. Flexify est également intégré aux fournisseurs de réseau-service (NaaS), tels que le mégaport du partenaire OCI, et peut provisionner/déprovisionner des connexions rapides sur demande. Pour plus d'informations, voir Migrer des données entre des nuages et Solution Megaport et Flexify pour les E/S.
-
Resilio Active Anywhere : Application de transfert de données de tierce partie basée sur un agent. Il s'agit d'une interface graphique (GUI) riche qui permet de contrôler les tâches de transfert et de visualiser les mesures de performances. Le logiciel est disponible dans Oracle Cloud Marketplace et fait l'objet d'une licence de Resilio pour installation. Resilio peut synchroniser des fichiers dans des délais fixes dans n'importe quelle direction dans un maillage un-à-plusieurs, plusieurs-à-un ou plusieurs-à-plusieurs permettant une présence globale à un jeu de données. Pour plus d'informations, voir Migration de données vers et entre les services de stockage OCI à l'aide de Resilio Connect et Resilio Active Anywhere.
-
Utilitaires de synchronisation Linux à source ouverte : rsync et fpsync.
-
Rsynchronisation : Outil commun basé sur Unix pour effectuer une copie ponctuelle ou une synchronisation périodique entre les chemins source et de destination.
-
Fpsync : Outil à source ouverte pour effectuer une synchronisation parallèle. Il utilise rsync, tar ou rclone en dessous et exécute un wrapper parallèle sur le dessus. Vous pouvez choisir rsync, tar ou rclone comme outil de synchronisation sous-jacent.
-
-
Utilisation des outils parallèles de stockage de fichiers : OCI File Storage a livré un ensemble d'outils parallèles qui fonctionne de manière optimale avec le système de fichiers. Il est disponible avec le référentiel développeur Linux et peut être installé directement à partir du référentiel yum. Le paquet contient trois outils qui sont parcp, parter et param qui sont l'équivalent parallèle des utilitaires standard Linux cp, tar et rm respectivement.
-
Synchronisation du stockage d'objets de l'interface de ligne de commande OCI : La synchronisation du stockage d'objets OCI fait partie de l'interface de ligne de commande OCI qui synchronise un répertoire du système de fichiers avec les objets d'un seau. La commande parcourt les sous-répertoires copiant des fichiers ou objets nouveaux et modifiés de la source vers la destination et supprimant éventuellement ceux qui ne sont pas présents dans la source. Il peut exécuter jusqu'à 1 00 opérations parallèles, selon les ressources de la machine hôte.
-
API Python de copie en masse du service de stockage d'objets pour OCI : Le lien suivant est un exemple de script de copie en masse utilisant l'API python pour OCI. L'API peut être utilisée pour écrire des scripts tels que l'exemple de script qui utilise des unités d'exécution parallèles pour copier des objets d'un seau dans un autre. Pour plus d'informations sur l'utilisation de l'exemple de script, voir Utiliser les utilitaires Python d'Oracle Cloud Infrastructure Object Storage pour les opérations en masse.
-
Outil compatible S3 (s5cmd) : s5cmd est un outil à code source libre qui peut être utilisé pour migrer ou synchroniser des systèmes de fichiers locaux et du stockage NAS (sur place et dans OCI) dans le stockage d'objets OCI. Il peut également être utilisé pour migrer un seau à un seau de données dans la même région.
Le bon outil pour le travail
Il y a beaucoup d'outils à choisir lors d'une migration, et il peut être écrasant de les rechercher tous en même temps. En fonction de l'origine, de la destination, de la direction de la migration, de l'expérience utilisateur et de l'environnement de l'utilisateur, le meilleur outil de migration variera.
Le tableau suivant fournit des recommandations pour les scénarios de migration courants, notamment la migration des données sur place, la migration des données d'un autre fournisseur de services en nuage vers OCI, la copie des données de stockage en nuage OCI d'une région vers une autre, la copie des données de stockage en nuage OCI dans une région et la copie des données de stockage de fichiers OCI vers le stockage d'objets OCI.
| Migrer les données depuis | Migrer les données vers | Outil(s) recommandé(s) | Notes | Liens Documentation/Tutoriel |
|---|---|---|---|---|
| Système de fichiers sur place | Service de stockage d'objets pour OCI | 1. s5cmd (petits fichiers/fichiers mixtes) 2. OCI Object Storage Sync (quelques fichiers volumineux) 3. Rclone (mixte) 4. Resilio actif partout |
Utilisez l'outil le mieux adapté à vos structures de données et vous sentez à l'aise de l'utiliser. FastConnect doit être révisée afin d'améliorer le temps de transfert. | S5cmd et le tutoriel sur la synchronisation du stockage d'objets, Tutoriel sur le clonage, Resilio Active Anywhere |
| Autre objet de fournisseur en nuage ou stockage BLOB | Service de stockage d'objets pour OCI | 1. Flexifier les E/S 2. Rclone |
Utilisez Flexify IO pour les fournisseurs compatibles S3 et lorsqu'une interface graphique prise en charge est souhaitée. Utilisez Rclone lorsque vous êtes à l'aise pour expérimenter et basculer divers paramètres et pour la prise en charge la plus compatible de plus de 70 fournisseurs de nuage différents (stockage d'objets compatible S3 et non compatible S3). |
Flexifier la migration des E/S entre les nuages, Tutoriel sur le clonage |
| Service de stockage d'objets pour OCI | OCI Object Storage dans une autre région | 1. Réplication d'objet 2. API Python de copie en masse du service de stockage d'objets pour OCI 3. Flexifier les E/S 4. Rclone |
L'utilisation de la réplication d'objet native est appropriée pour une réplique exacte d'un nouveau seau actuellement vide. Utilisez l'API Python de copie en masse du service de stockage d'objets pour OCI, Flexify IO ou Rclone pour initialiser les copies d'un seau source qui contient déjà des objets ou lorsque vous voulez conserver des objets sur la destination. | Documentation sur Object Storage Replication, Utiliser les utilitaires Python d'Oracle Cloud Infrastructure Object Storage pour les opérations en masse, Flexify IO, Tutoriel Clone |
| Service de stockage d'objets pour OCI | OCI Object Storage dans une autre location (même région ou région différente) | 1. API Python de copie en masse du service de stockage d'objets pour OCI 2. Flexifier les E/S 3. Rclone |
Prérequis pour l'API Python de copie en masse du service de stockage d'objets pour OCI : Utilisez des politiques IAM interlocation pour activer les copies interlocation. Pour plus d'informations, voir Accès aux ressources de stockage d'objets entre des locations. | Utiliser les utilitaires Python d'Oracle Cloud Infrastructure Object Storage pour les opérations en masse, Flexifier les E/S, Tutoriel sur le clonage |
| Service de stockage de fichiers pour OCI | Service de stockage d'objets pour OCI | 1. s5cmd (petits fichiers/fichiers mixtes) 2. Synchronisation du stockage d'objets (quelques fichiers volumineux) 3. Rclone (mixte) 4. Resilio actif partout |
Utilisez l'outil le mieux adapté à vos structures de données et vous sentez à l'aise de l'utiliser. | S5cmd et le tutoriel sur la synchronisation du stockage d'objets, Tutoriel sur le clonage, Resilio Active Anywhere |
| Système de fichiers sur place | Service de stockage de fichiers pour OCI | 1. fpsync (Linux) et CIFS + fpsync (Windows) 2. Resilio actif partout |
Assurez-vous que la connectivité réseau est établie entre les instances source et de destination. | Documentation sur Fpsync, tutoriel fpsync, Resilio Active Anywhere |
| Disque ou stockage de fichiers local d'un autre fournisseur en nuage | Service de stockage de fichiers pour OCI | 1. fpsync (Linux) et CIFS + fpsync (Windows) 2. Resilio actif partout |
Assurez-vous que la connectivité réseau est établie entre les instances source et de destination. FastConnect doit être révisée afin d'améliorer le temps de transfert. | Documentation sur Fpsync, tutoriel fpsync, Resilio Active Anywhere |
| Service de stockage de fichiers pour OCI | Stockage de fichiers OCI dans une autre région | 1. Réplication du système de fichiers 2. fpsync avec la diffusion en continu d'instance à instance 3. Resilio actif partout |
Si vous utilisez la réplication, voir les limites et points à considérer de la réplication ou si vous utilisez la diffusion en continu d'instance à instance, assurez-vous que la connectivité réseau est établie entre les instances source et de destination. | Documentation sur Fpsync, tutoriel fpsync, Documentation sur File System Replication, Resilio Active Anywhere |
| Service de stockage de fichiers pour OCI | OCI File Storage dans le même domaine de disponibilité | 1. Réplication de système de fichiers 2. Utilisation des outils parallèles de stockage de fichiers : parcp 3. Resilio actif partout |
Si vous utilisez la réplication, voir les limites et points à considérer de la réplication ou si vous utilisez parcp, assurez-vous que les systèmes de fichiers source et de destination sont montés dans l'instance. | Réplication du système de fichiers, Utilisation des outils parallèles de stockage de fichiers : parcp, Resilio Active Anywhere |
| Sur place, un autre fournisseur de services en nuage | OCI Object Storage ou OCI File Storage | Plateforme Resilio Active Anywhere | Utilisez la plate-forme Resilio Active Anywhere lorsque vous avez besoin d'une synchronisation multidirectionnelle des données, d'un service de gants blancs avec support et d'une interface graphique. Resilio a été vérifié par l'équipe chargée du service de stockage en nuage pour OCI et est disponible dans Oracle Cloud Marketplace. | Pour plus d'informations sur l'utilisation de leur plate-forme, communiquez avec l'équipe Resilio. |
Note : La série d'outils de migration ne couvrira pas le service de stockage d'objets pour OCI ou la réplication de système de fichiers pour OCI, l'API Python de copie en masse du service de stockage d'objets pour OCI, Flexify et Resilio. Voir Liens connexes pour plus d'informations.
Étapes suivantes
Passez au(x) tutoriel(s) correspondant(s) à vos besoins en matière de migration. Pour déplacer des données vers les services de stockage en nuage OCI :
-
À l'aide de Rclone, voir Tutoriel 2 : Déplacer des données vers les services de stockage en nuage OCI à l'aide de Rclone.
-
À l'aide de la synchronisation du service de stockage d'objets pour OCI et de S5cmd, voir Tutoriel 3 : Déplacer des données dans les services de stockage en nuage pour OCI à l'aide de la synchronisation du service de stockage d'objets pour OCI et S5cmd. :w
-
À l'aide de Fpsync et de Rsync pour les migrations de données de système de fichiers, voir Tutoriel 4 : Déplacer des données vers les services de stockage en nuage OCI à l'aide de Fpsync et de Rsync pour les migrations de données de système de fichiers.
(Facultatif) Environnements de test
Les recommandations sont faites sur la base des tests et des interactions avec les clients.
Environnement de test 1 :
1 instance de machine virtuelle VM.Standard.E4.Flex, 1 OCPU, bande passante de réseau 1Gbps, 16 Go de mémoire. Pour simuler une migration sur place vers OCI, des données copiées de PHX NFS vers IAD.
Jeux de données
- Jeu de données 1 : Migration de données depuis un système de fichiers monté sur NFS vers le stockage d'objets OCI.
Taille totale du jeu de données : 3 To, avec 3 fichiers, chaque fichier étant de 1 To.
| Méthode | De | Temps | Commande | Indicateurs |
|---|---|---|---|---|
| synchronisation du système d'exploitation | NFS/Fichier PHX vers IAD d'objet | 123m17.102s | S.O. | --parallel-operations-count 100 |
| s5cmd | NFS/Fichier PHX vers IAD d'objet | 239m20.625s | copie | run commands.txt, exécution par défaut --numworkers 256 |
| rclone | NFS/Fichier PHX vers IAD d'objet | 178m27.101s | copie | --transfers=100 --oos-no-check-bucket --fast-list --checkers 64 --retries 2 --no-check-dest |
Note : Nos tests ont montré que
os syncfonctionnait le plus rapidement pour ce jeu de données.
- Jeu de données 2 : Migration de données depuis un système de fichiers monté sur NFS vers le service de stockage d'objets pour OCI
Taille totale du jeu de données : 9.787GB, avec 20 000 fichiers, chaque fichier ayant 20 Mo
| Méthode | De | Temps | Commande | Indicateurs |
|---|---|---|---|---|
| s5cmd | NFS/Fichier PHX vers IAD d'objet | 1m12.746s | copie | exécution par défaut --numworkers 256 |
| synchronisation du système d'exploitation | NFS/Fichier PHX vers IAD d'objet | 2m48.742s | S.O. | --parallel-operations-count 1000 |
| rclone | NFS/Fichier PHX vers IAD d'objet | 1m52.886s | copie | --transfers=500 --oos-no-check-bucket --no-check-dest |
Note : Nos tests ont montré que
s5cmdoffre les meilleures performances pour ce jeu de données.
Environnement de test 2 :
Instances de machine virtuelle : 2 instances de machine virtuelle ont été utilisées pour chaque test. Nous avons utilisé un VM.Standard.E4.Flex avec 24 OCPU, une bande passante de réseau 24Gbps, 384 Go de mémoire. Oracle Linux 8 a été utilisé pour les tests Linux. Flexify IO n'utilise pas d'instances de machine virtuelle.
Jeux de données utilisés pour les tests : 14 répertoires principaux avec le nombre et la taille de fichiers suivants, totalisant 2.25TiB.
| Répertoire du jeu de données | Taille | Nombre de fichiers | Taille de chaque fichier |
|---|---|---|---|
| Répertoire 1 | 107.658 Gio | 110 242 | 1 Mio |
| Répertoire 2 | 1.687 Gio | 110 569 | 15 Mio |
| Répertoire 3 | 222 Gio | 111 | 2 Gio |
| Répertoire 4 | 1.265 Tio | 1 295 | 1 Gio |
| Répertoire 5 | 26.359 Gio | 1 687 | 16 Mio |
| Répertoire 6 | 105.281 Mio | 26 952 | 4 Kio |
| Répertoire 7 | 29.697 Mio | 30 410 | 1 Kio |
| Répertoire 8 | 83.124 Gio | 340 488 | 256 Kio |
| Répertoire 9 | 21.662 Gio | 354 909 | 64 Kio |
| Répertoire 10 | 142.629 Gio | 36 514 | 4 Mio |
| Répertoire 11 | 452.328 Mio | 57 898 | 8 Mio |
| Répertoire 12 | 144 Gio | 72 | 2Gio |
| Répertoire 13 | 208.500 Gio | 834 | 256 Mio |
| Répertoire 14 | 54.688 Gio | 875 | 64 Mio |
Note :
- Les 14 répertoires ont été fractionnés entre les 2 instances de machine virtuelle, le cas échéant.
- Chaque machine virtuelle a exécuté 7 commandes/processus, 1 pour chaque répertoire, sauf indication contraire.
| Méthode | De | Temps | Commande | Indicateurs/Notes |
|---|---|---|---|---|
| s5cmd | NFS/Fichier PHX vers IAD d'objet | 54m41.814s | copie | --numworkers 74 |
| synchronisation du système d'exploitation | NFS/Fichier PHX vers IAD d'objet | 65m43.200s | S.O. | --parallel-operations-count 50 |
| rclone | NFS/Fichier PHX vers IAD d'objet | 111m59.704s | copie | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 50 |
| rclone | Objet PHX vers IAD d'objet | 28m55.663s | copie | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 400, même commande exécutée sur 2 machines virtuelles pour un accès simultané de 800 transferts |
| Script de copie en masse python | Objet PHX vers IAD d'objet | 25m43.715s | Valeur par défaut | 1 machine virtuelle, 50 programmes, 100 000 fichiers mis en file d'attente à la fois |
| Flexibilité des E/S | Objet PHX vers IAD d'objet | 20m27s | copie | La valeur par défaut est 10 moteurs/emplacements |
| Flexibilité des E/S | Objet PHX vers IAD d'objet | 16m12s | copie | 20 moteurs / fentes, cela peut être soulevé via "Paramètres avancés" |
Les commandes s5cmd et os sync passent bien du système de fichiers/NFS au stockage d'objets. Le script de Flexify IO et de copie en masse se concentre uniquement sur les transferts de stockage d'objets (compartiment à compartiment) et n'a pas été testé pour la migration NFS.
Seuls Flexify IO,rclone et le script de copie en masse python sont capables d'effectuer des transferts seau à seau entre régions afin que les autres outils n'aient pas été testés pour cela. Flexify IO effectue les meilleures performances pour les migrations de stockage d'objets entre les régions, le script de copie en masse python étant plus performant que rclone. Il est important de noter que Flexify IO fonctionne pour le stockage d'objets compatible S3, que le script de copie en masse python ne fonctionne qu'avec le stockage d'objets OCI et que rclone prend en charge de nombreux serveurs dorsaux et fournisseurs de nuage.
De petites exécutions de test ont été effectuées à l'aide de rclone pour transférer des données de Microsoft Azure Blob Storage, Amazon Simple Storage Service (Amazon S3) et Google Cloud Platform Cloud Storage vers OCI Object Storage afin de vérifier que l'outil fonctionne pour ces types de transferts. Pour plus d'informations, voir Déplacer les données vers le stockage d'objets en nuage à l'aide de Rclone.
FlexifyIO a été utilisé pour migrer ce jeu de données de us-east-2 AWS vers la région Ashburn d'OCI et n'a pris que 23m51s pour 2.25TiB à l'aide de la valeur par défaut de 10 moteurs/emplacements, des moteurs/emplacements supplémentaires ont pu être ajoutés pour une performance plus rapide.
Environnement de test 3 :
Instances de machine virtuelle : 1 à 2 instances de machine virtuelle ont été utilisées pour chaque test, nous avons utilisé un VM.Standard.E4.Flex avec 24 OCPU, une bande passante de réseau 24Gbps, 384 Go de mémoire. Oracle Linux 8 a été utilisé pour les tests Linux. Tous les tests étaient de seau à seau. Flexify IO n'utilise pas d'instances de machine virtuelle.
| Taille totale | Nombre de fichiers | Intervalle de tailles de fichier |
|---|---|---|
| 7.74 Tio | 1 000 000 | 30 Mio |
| Méthode | De | Temps | Commande | Indicateurs | Notes | |
|---|---|---|---|---|---|---|
| rclone | IAD objet à objet -> IAD | 18h39m11.4s | copie | --oos-no-check-bucket --fast-list --no-traverse --transfers 500 --oos-chunk-size 10Mi |
1 machine virtuelle, très lente en raison du nombre élevé de fichiers et de la liste des appels à la source | |
| rclone | IAD objet à objet -> IAD | 55m8.431s | copie | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
2 machines virtuelles, 500 transferts par machine virtuelle, liste d'objets/fichiers alimentée en 1 000 fichiers à la fois, empêche la liste à la source et à la destination et améliore les performances | |
| Script de copie en masse python | IAD objet à objet -> IAD | 28m21.013s | S.O. | Valeur par défaut | 1 machine virtuelle, 50 programmes, 100 000 fichiers mis en file d'attente à la fois | |
| Script de copie en masse python | IAD objet à objet -> IAD | S.O. | S.O. | Valeur par défaut | 2 machines virtuelles, 50 programmes par machine virtuelle, 100 000 fichiers en file d'attente à la fois. 429 erreurs reçues, script bloqué et impossible de terminer | |
| Flexibilité des E/S | IAD objet à objet -> IAD | 39m19s | copie | Valeur par défaut | La valeur par défaut est 10 moteurs/lots | |
| Flexibilité des E/S | IAD objet à objet -> IAD | 21m37s | copie | 20 moteurs/ fentes | Réglé à 20 moteurs / emplacements, cela peut être soulevé via "Paramètres avancés" | |
| s5cmd | IAD objet à objet -> IAD | 14m10.864s | copie | Valeurs par défaut (256 travailleurs) | 1 VM | S.O. |
| s5cmd | IAD objet à objet -> IAD | 7m50.013s | copie | Valeurs par défaut | 2 VM, 256 salariés par VM | Exécuté la moitié du temps en tant que 1 machine virtuelle |
| s5cmd | IAD objet à objet -> IAD | 3m23.382s | copie | --numworkers 1000 |
1 MV, 1000 travailleurs | Pour plusieurs tests, nous avons constaté qu'il s'agissait de l'exécution optimale pour ce jeu de données avec s5cmd |
| rclone | IAD objet-à-objet -> PHX | 184m36.536s | copie | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
2 machines virtuelles, 500 transferts par machine virtuelle, liste d'objets/fichiers alimentée 1 000 fichiers à la fois | |
| Script de copie en masse python | IAD objet-à-objet -> PHX | 35m31.633s | S.O. | Valeur par défaut | 1 machine virtuelle, 50 travailleurs, 100 000 fichiers en file d'attente à la fois | |
| Flexibilité des E/S | IAD objet-à-objet -> PHX | 21m17s | copie | 20 moteurs/ fentes | Réglé à 20 moteurs / emplacements, cela peut être soulevé via "Paramètres avancés" |
La commande s5cmd s'exécutait de manière cohérente pour le nombre de fichiers volumineux et les petits fichiers. La valeur s5cmd est limitée, car elle ne peut effectuer que des copies de seau à seau dans la même location et la même région.
Flexify IO serait l'outil recommandé pour ce jeu de données de migration, car il fonctionne bien et prend en charge divers types de stockage d'objets compatibles S3. Le temps de migration a diminué après le relèvement du nombre de moteurs/lieux pour Flexify IO.
Notez les améliorations élevées apportées à rclone une fois que les fichiers sont transmis à la commande et qu'ils passent de l'extensibilité à une autre machine virtuelle. Rclone peut fonctionner plus lentement que d'autres outils, mais il est le plus polyvalent dans les différentes plates-formes qu'il prend en charge et les types de migrations qu'il peut effectuer.
L'API Python pour la copie en masse du service de stockage d'objets pour OCI peut uniquement utiliser l'API native CopyObject d'OCI et ne peut accéder à une simultanéité d'accès qu'à 50 travailleurs avant d'être ralentie. Elle fonctionne généralement assez bien pour ce jeu de données.
Les tests IAD à PHX n'ont été effectués que sur ce qui fonctionnait le mieux dans IAD à IAD et les tests problématiques n'ont pas été réexécutés. La commande s5cmd n'a pas été exécutée pour IAD vers PHX, car elle ne peut effectuer que des copies de seau à seau dans la même région.
Liens connexes
-
Transfert de données vers et depuis le service de stockage de fichiers
-
Notions essentielles pour la migration des données vers OCI Cloud Storage
-
Tutoriel 2 : Déplacer des données vers les services de stockage en nuage pour OCI à l'aide de Rclone
-
Déplacer les données vers le stockage d'objets en nuage à l'aide de Rclone
-
Rcloner la documentation sur le service de stockage d'objets pour OCI
-
Migration de données vers et entre les services de stockage OCI à l'aide de Resilio Connect
Remerciements
-
Authors - Vinoth Krishnamurthy (membre principal du personnel technique, service de stockage de fichiers pour OCI), Melinda Centeno (gestionnaire principal de produit, service de stockage d'objets pour OCI)
-
Contributeurs - Aboo Valappil (membre conseiller du personnel technique, service de stockage de fichiers et par blocs pour OCI), Ashutosh Mate (gestionnaire principal de produit principal, service de stockage d'objets pour OCI)
Ressources d'apprentissage supplémentaires
Explorez d'autres laboratoires sur le site docs.oracle.com/learn ou accédez à plus de contenu d'apprentissage gratuit sur le canal Oracle Learning YouTube. De plus, visitez education.oracle.com/learning-explorer pour devenir un explorateur Oracle Learning.
Pour obtenir la documentation sur le produit, visitez Oracle Help Center.
Use Migration Tools to Move Data into OCI Cloud Storage Services
G25553-02