마이그레이션 툴을 사용하여 OCI 클라우드 스토리지 서비스로 데이터 이동
소개
이 자습서 시리즈는 Oracle Cloud Infrastructure(OCI) 클라우드 스토리지 서비스로 데이터를 마이그레이션하는 다양한 방법을 보여주는 4가지 튜토리얼 시리즈 중 1번째 자습서입니다. 시리즈가 설정되므로 이 첫 번째 자습서를 검토하여 다양한 도구를 광범위하게 이해한 다음 마이그레이션 요구 사항과 관련된 관련 자습서 또는 문서로 진행할 수 있습니다.
OCI는 고객에게 고성능 컴퓨팅 및 저비용 클라우드 스토리지 옵션을 제공합니다. Oracle은 온디맨드 로컬, 객체, 파일, 블록 및 아카이브 스토리지를 통해 주요 스토리지 워크로드 요구 사항과 사용 사례를 해결합니다.
OCI 클라우드 스토리지 서비스는 기업의 모든 니즈에 맞춰 빠르고 안전하며 내구성이 뛰어난 클라우드 스토리지 옵션을 제공합니다. OCI File Storage with Lustre 및 OCI Block Volumes 서비스, 고성능 마운트 대상을 갖춘 OCI File Storage 서비스의 완전 관리형 엑사바이트 규모 파일 시스템, 내구성과 확장성이 뛰어난 OCI Object Storage와 같은 고성능 옵션부터 시작합니다. Oracle의 솔루션은 AI/ML 워크로드와 같은 성능 집약적 애플리케이션에서부터 엑사바이트 규모의 데이터 레이크에 이르기까지 고객의 요구를 충족할 수 있습니다.
대부분의 고객은 온프레미스, 다른 제공업체 또는 OCI 클라우드 스토리지 서비스 간에 데이터를 OCI 클라우드 스토리지 서비스로 전송해야 합니다. 원본, 대상 및 데이터 전송 방향에 따라 마이그레이션을 수행하는 가장 좋은 방법은 다를 수 있습니다. OCI에서 데이터 소스 및 대상의 기본 사항을 확인한 후에는 마이그레이션 경로와 사용할 도구를 결정해야 합니다. 오라클의 실습 경험을 통해 올바른 마이그레이션 도구 및 사용 방법을 안내합니다. 이 자습서 1은 다양한 도구와 마이그레이션 프로세스에 가장 적합한 위치를 소개합니다.
마이그레이션해야 하는 데이터의 양과 새로운 OCI 스토리지 플랫폼으로 컷오버하는 데 사용할 수 있는 다운타임을 결정합니다. 일괄 마이그레이션은 마이그레이션을 관리 가능한 증분으로 분석하는 좋은 선택입니다. 일괄 마이그레이션을 사용하면 여러 창에서 특정 애플리케이션의 작동 중지 시간을 예약할 수 있습니다. 일부 고객은 일정이 잡힌 유지보수 기간 동안 2-4일 동안 일회성 마이그레이션을 유연하게 수행할 수 있습니다. OCI FastConnect는 OCI와 사용자 환경 간의 전용 프라이빗 연결을 생성하는 데 사용할 수 있으며, 1G에서 400G까지의 포트 속도를 통해 데이터 전송 프로세스의 속도를 높일 수 있습니다. OCI FastConnect는 Megaport 및 ConsoleConnect와 같은 파트너 솔루션과 통합되어 데이터 센터 또는 클라우드 간 상호 연결에 대한 프라이빗 연결을 생성하여 다른 클라우드 공급업체에서 OCI 클라우드 스토리지 서비스로 데이터를 더 직접 이동할 수 있습니다. 자세한 내용은 Megaport Cloud Router와 FastConnect 통합을 참조하십시오.
대상
DevOps 엔지니어, 개발자, OCI 클라우드 스토리지 관리자 및 사용자, IT 관리자, OCI 고급 사용자 및 애플리케이션 관리자.
목표
다양한 도구를 사용하여 데이터를 복사하고 OCI 클라우드 스토리지 서비스로 동기화하는 방법을 알아봅니다.
-
일반적인 마이그레이션 도구를 식별합니다.
-
파일 시스템 데이터(로컬, NAS, 클라우드 호스팅)를 OCI 클라우드 스토리지 서비스로 마이그레이션하기 위한 다양한 도구에 대해 알아보세요.
-
다양한 사용 사례에 가장 적합한 도구를 알아봅니다.
필수 조건
-
데이터 이전 집합, 전체 크기 및 파일이나 객체의 모양(대형 파일은 거의 없고 작은 파일도 많음)에 대한 이해
-
OCI 클라우드 스토리지 서비스(오브젝트 스토리지, 파일 스토리지 또는 블록 볼륨)에서는 스토리지가 착륙해야 합니다.
-
일정 및 대량 또는 증분(일괄) 마이그레이션을 수행할지 여부입니다.
마이그레이션 툴
Oracle의 고객 경험과 테스트는 귀사의 시나리오에 가장 적합한 마이그레이션 툴을 안내합니다. 샘플 데이터 세트에 대한 개념 증명 및 테스트를 수행하여 데이터 세트에 가장 적합한 마이그레이션 방법을 확인하는 것이 좋습니다. 온프레미스 및 기타 클라우드 제공업체에서 OCI 또는 OCI 클라우드 스토리지 서비스로 데이터를 마이그레이션하는 데 사용할 수 있는 일반적인 마이그레이션 툴을 살펴봅니다. 테스트 결과는 샘플 데이터 세트에서 공유되므로 데이터 세트에서 도구가 수행할 수 있는 방법을 추정할 수 있습니다.
-
복제본: Rclone은 클라우드로 또는 클라우드 스토리지 공급업체 간에 데이터를 마이그레이션하는 오픈 소스 명령줄 유틸리티입니다. Rclone은 소스 스토리지와 대상 스토리지 간의 정기적인 동기화뿐만 아니라 일회성 마이그레이션을 수행하는 데 사용할 수 있습니다. Rclone은 오브젝트 스토리지, 파일 스토리지, 마운트된 드라이브 및 지원되는 70개의 스토리지 유형 간에 데이터를 마이그레이션할 수 있습니다. OCI Object Storage는 기본적으로 Rclone 백엔드 제공업체로 지원됩니다. Rclone 프로세스는 파라미터 옵션을 사용하여 전송 성능을 높이기 위해 확장 및 축소할 수 있습니다. Rclone은 복사 및 동기화와 같은 옵션을 사용하여 데이터를 일회성 및 주기적으로 전송할 수 있습니다. 자세한 내용은 Install Rclone를 참조하십시오.
-
IO를 유연화: Flexify IO는 객체 스토리지에 초점을 맞춘 사용하기 쉬운 타사 마이그레이션 도구입니다. Flexify는 S3 호환 클라우드(OCI, AWS, GCP, Azure 등) 및 온프레미스(Minio, Dell EMC ECS 등) 객체 스토리지에서 작동합니다. Flexify management에 로그인하고 자격 증명/액세스 키를 구성하고 GUI(그래픽 사용자 인터페이스)를 통해 마이그레이션을 설정하기만 하면 됩니다. 유연한 IO의 수평 확장 알고리즘은 연결성만큼 빠르게 자동 확장되며 스토리지가 허용됩니다. Flexify는 OCI 파트너 Megaport와 같은 서비스형 네트워크(NaaS) 제공업체와도 통합되며, 필요에 따라 빠른 연결을 프로비저닝/프로비저닝 해제할 수 있습니다. 자세한 내용은 클라우드 간 데이터 마이그레이션 및 Megaport and Flexify IO 솔루션을 참조하십시오.
-
Resilio Active Anywhere: Resilio는 제3자 에이전트 기반 데이터 전송 애플리케이션입니다. 풍부한 GUI(그래픽 사용자 인터페이스)로 전송 작업을 효과적으로 제어하고 성능 metrics를 시각화할 수 있습니다. 이 소프트웨어는 Oracle Cloud Marketplace에서 사용할 수 있으며 Resilio의 설치 라이센스가 부여됩니다. Resilio는 고정 시간 프레임의 파일을 일대다, 다대일 또는 다대다 메시의 어떤 방향으로든 동기화하여 데이터 세트에 대한 전역 존재를 가능하게 할 수 있습니다. 자세한 내용은 Resilio Connect를 사용한 OCI 스토리지 서비스 간 데이터 마이그레이션 및 Resilio Active Anywhere를 참고하세요.
-
오픈 소스 Linux 동기화 유틸리티: rsync 및 fpsync.
-
동기화: 소스 경로와 대상 경로 간에 일회성 복사 또는 주기적 동기화를 수행하는 공통 Unix 기반 도구입니다.
-
Fpsync: 병렬 동기화를 수행하는 오픈 소스 도구입니다. 아래 rsync, tar 또는 rclone을 사용하고 맨 위에 병렬 래퍼를 실행합니다. 기본 동기화 도구로 rsync, tar 또는 rclone 중 하나를 선택할 수 있습니다.
-
-
파일 스토리지 병렬 도구 사용: OCI File Storage는 파일 시스템과 최적으로 작동하는 병렬 도구 패키지를 제공했습니다. Linux 개발자 저장소에서 사용할 수 있으며 yum 저장소에서 직접 설치할 수 있습니다. 이 패키지는 각각 표준 Linux 유틸리티 cp, tar 및 rm과 병렬로 동등한 parcp, parter 및 param의 세 가지 도구를 포함합니다.
-
OCI 명령줄 인터페이스 오브젝트 스토리지 동기화: OCI 오브젝트 스토리지 동기화(동기화)는 파일 시스템 디렉토리를 버킷의 객체와 동기화하는 OCI CLI(명령줄 인터페이스)의 일부입니다. 이 명령은 새 파일과 수정된 파일 또는 객체를 소스에서 대상으로 복사하고 선택적으로 소스에 없는 파일 또는 객체를 삭제하는 하위 디렉토리를 순회합니다. 호스트 시스템 리소스에 따라 최대 1,00개의 병렬 작업을 실행할 수 있습니다.
-
OCI Object Storage 대량 복사 Python API: 다음 링크는 OCI용 python API를 사용하는 대량 복사 스크립트의 예입니다. API는 병렬 스레드를 사용하여 한 버킷에서 다른 버킷으로 객체를 복사하는 예제 스크립트와 같은 스크립트를 작성하는 데 사용할 수 있습니다. 샘플 스크립트 사용에 대한 자세한 내용은 대량 작업에 Oracle Cloud Infrastructure Object Storage Python 유틸리티 사용을 참조하십시오.
-
S3 호환 툴(s5cmd): s5cmd은 로컬 파일 시스템 및 NAS 스토리지(온프레미스 및 OCI)를 OCI Object Storage로 마이그레이션하거나 동기화하는 데 사용할 수 있는 오픈 소스 툴입니다. 또한 동일한 리전 내에서 데이터 버킷을 버킷으로 마이그레이션하는 데 사용할 수도 있습니다.
작업에 적합한 도구
마이그레이션을 수행할 때 선택할 수 있는 여러 가지 도구가 있으며, 한 번에 모두 조사하는 것이 압도적일 수 있습니다. 마이그레이션의 시작, 목적지, 방향, 사용자 경험 및 사용자 환경에 따라 최상의 마이그레이션 툴이 달라집니다.
다음 표는 온프레미스 데이터 마이그레이션, 다른 클라우드 공급업체의 데이터 마이그레이션, 한 리전에서 다른 리전으로 OCI 클라우드 스토리지 데이터 복사, 한 리전 내에서 OCI 클라우드 스토리지 데이터 복사, OCI File Storage 데이터를 OCI Object Storage로 복사 등 일반적인 마이그레이션 시나리오에 대한 권장 사항을 제공합니다.
| 데이터 이전 출처 | 데이터 이전 대상 | 권장 도구 | 참고 | 설명서/자습서 링크 |
|---|---|---|---|---|
| 온프레미스 파일 시스템 | OCI 오브젝트 스토리지 | 1. s5cmd (작은/혼합 파일) 2. OCI Object Storage Sync(큰 파일은 거의 없음) 3. Rclone(혼합) 4. 어디서나 활성화된 탄력성 |
데이터 구조에 가장 적합한 도구를 사용하고 사용하기 편합니다. 전송 시간을 향상시키려면 FastConnect을(를) 검토해야 합니다. | S5cmd 및 Object Storage Sync 자습서, Rclone 자습서, Resilio Active Anywhere |
| 다른 클라우드 공급업체 객체 또는 Blob 스토리지 | OCI 오브젝트 스토리지 | 1. IO를 유연화 2. 복제 |
S3 호환 공급업체 및 지원되는 GUI 인터페이스가 필요한 경우 Flexify IO를 사용합니다. 다양한 설정과 70개 이상의 서로 다른 클라우드 벤더(S3 호환 및 S3 호환되지 않는 객체 스토리지)를 지원하는 가장 호환되는 설정을 실험하고 토글할 때 Rclone을 사용합니다. |
클라우드 간 IO 마이그레이션을 유연화, 복제 자습서 |
| OCI 오브젝트 스토리지 | 다른 지역의 OCI Object Storage | 1. 객체 복제 2. OCI Object Storage 대량 복사 Python API 3. IO를 유연화 4. 복제 |
네이티브 오브젝트 복제는 현재 비어 있는 새 버킷의 정확한 복제에 적합합니다. OCI Object Storage Bulk Copy Python API, Flexify IO 또는 Rclone을 사용하여 이미 오브젝트가 있거나 대상에서 오브젝트를 보존하려는 소스 버킷의 복사본을 초기화합니다. | 오브젝트 스토리지 복제 설명서, 대량 작업에 Oracle Cloud Infrastructure Object Storage Python 유틸리티 사용, IO 유연화, Rclone 자습서 |
| OCI 오브젝트 스토리지 | 다른 테넌시의 OCI Object Storage(동일한 지역 또는 다른 지역) | 1. OCI Object Storage 대량 복사 Python API 2. IO를 유연화 3. 복제 |
OCI Object Storage 대량 복사 Python API의 필요 조건: 교차 테넌시 IAM 정책을 사용하여 교차 테넌시 복사본을 사용으로 설정합니다. 자세한 내용은 테넌시 전체에서 오브젝트 스토리지 리소스 액세스를 참조하십시오. | 대량 운영을 위한 Oracle Cloud Infrastructure Object Storage Python 유틸리티 사용, IO 유연화, 자습서 복제 |
| OCI File Storage | OCI 오브젝트 스토리지 | 1. s5cmd (작은/혼합 파일) 2. 오브젝트 스토리지 동기화(큰 파일은 거의 없음) 3. Rclone(혼합) 4. 어디서나 활성화된 탄력성 |
데이터 구조에 가장 적합한 도구를 사용하고 사용하기 편합니다. | S5cmd 및 Object Storage Sync 자습서, Rclone 자습서, Resilio Active Anywhere |
| 온프레미스 파일 시스템 | OCI File Storage | 1. fpsync(Linux) 및 CIFS + fpsync(Windows) 2. 어디서나 활성화된 탄력성 |
소스 인스턴스와 대상 인스턴스 간에 네트워크 접속이 설정되었는지 확인합니다. | Fpsync 설명서, fpsync 자습서, Resilio Active Anywhere |
| 다른 클라우드 공급업체의 로컬 디스크 또는 파일 스토리지 | OCI File Storage | 1. fpsync(Linux) 및 CIFS + fpsync(Windows) 2. 어디서나 활성화된 탄력성 |
소스 인스턴스와 대상 인스턴스 간에 네트워크 접속이 설정되었는지 확인합니다. 전송 시간을 향상시키려면 FastConnect을(를) 검토해야 합니다. | Fpsync 설명서, fpsync 자습서, Resilio Active Anywhere |
| OCI File Storage | 다른 지역의 OCI File Storage | 1. 파일 시스템 복제 2. 인스턴스 간 스트리밍을 사용하는 fpsync 3. 어디서나 활성화된 탄력성 |
복제를 사용하는 경우 복제의 제한 사항 및 고려 사항을 참조하거나 인스턴스 간 스트리밍을 사용하는 경우 소스 인스턴스와 대상 인스턴스 간에 네트워크 연결이 설정되었는지 확인합니다. | Fpsync 설명서, fpsync 자습서, 파일 시스템 복제 설명서, Resilio Active Anywhere |
| OCI File Storage | 동일한 가용성 도메인 내의 OCI File Storage | 1. 파일 시스템 복제 2 파일 스토리지 병렬 도구 사용: parcp 3. 어디서나 활성화된 탄력성 |
복제를 사용하는 경우 복제의 제한 사항 및 고려 사항을 참조하거나 parcp를 사용하는 경우 소스 및 대상 파일 시스템이 모두 인스턴스에 마운트되었는지 확인합니다. | 파일 시스템 복제, 파일 스토리지 병렬 도구 사용: parcp, Resilio Active Anywhere |
| 온프레미스, 다른 클라우드 공급업체 | OCI Object Storage 또는 OCI File Storage | Resilio Active Anywhere 플랫폼 | 데이터 다방향 동기화, 지원이 포함된 화이트 글러브 서비스 및 GUI 인터페이스가 필요한 경우 Resilio Active Anywhere 플랫폼을 사용합니다. 리실리오는 OCI 클라우드 스토리지 서비스 제품 팀에서 확인했으며 Oracle Cloud Marketplace에서 확인할 수 있습니다. | 플랫폼 사용에 대한 자세한 내용은 Resilio 팀에 문의하십시오. |
참고: 마이그레이션 툴 시리즈에는 OCI Object Storage 또는 OCI File System Replication, OCI Object Storage Bulk Copy Python API, Flexify 및 Resilio가 포함되지 않습니다. 자세한 내용은 관련 링크를 참조하십시오.
다음 단계
이전 요구 사항과 관련된 관련 자습서로 이동합니다. 데이터를 OCI 클라우드 스토리지 서비스로 이동하려면 다음을 수행합니다.
-
Rclone을 사용하여 자습서 2: Rclone을 사용하여 OCI 클라우드 스토리지 서비스로 데이터 이동을 참조하십시오.
-
OCI Object Storage Sync 및 S5cmd를 사용하여 자습서 3: OCI Object Storage Sync 및 S5cmd를 사용하여 OCI Cloud Storage Services로 데이터 이동을 참조하십시오.
-
파일 시스템 데이터 마이그레이션을 위해 Fpsync 및 Rsync를 사용하는 경우 자습서 4: 파일 시스템 데이터 마이그레이션을 위해 Fpsync 및 Rsync를 사용하여 OCI 클라우드 스토리지 서비스로 데이터 이동을 참조하십시오.
(선택 사항) 테스트 환경
권장사항은 테스트 및 고객 상호작용을 기반으로 합니다.
테스트 환경 1:
VM 인스턴스 1개 VM.Standard.E4.Flex, OCPU 1개, 1Gbps 네트워크 대역폭, 16GB 메모리. 온프레미스에서 OCI로의 마이그레이션을 시뮬레이션하기 위해 PHX NFS에서 IAD로 데이터를 복사했습니다.
데이터 집합
- 데이터 세트 1: NFS 마운트된 파일 시스템에서 OCI Object Storage로 데이터 마이그레이션
총 데이터 세트 크기: 3TB, 파일 3개, 각 파일 1TB.
| 방법 | 종료-시작 | 시간 | 명령 | 플래그 |
|---|---|---|---|---|
| os 동기화 | 객체 IAD에 대한 NFS/File PHX | 123m17.102s | NA | --parallel-operations-count 100 |
| s5cmd | 객체 IAD에 대한 NFS/File PHX | 239m20.625s | 복사 | run commands.txt, 기본 실행 --numworkers 256 |
| 복제 | 객체 IAD에 대한 NFS/File PHX | 178m27.101s | 복사 | --transfers=100 --oos-no-check-bucket --fast-list --checkers 64 --retries 2 --no-check-dest |
주: 테스트 결과
os sync가 이 데이터 집합에 대해 가장 빠르게 실행되고 있습니다.
- 데이터 세트 2: NFS 마운트된 파일 시스템에서 OCI Object Storage로 데이터 마이그레이션
총 데이터 세트 크기: 9.787GB, 20,000개 파일 포함, 각 파일 20MB
| 방법 | 종료-시작 | 시간 | 명령 | 플래그 |
|---|---|---|---|---|
| s5cmd | 객체 IAD에 대한 NFS/File PHX | 1m12.746s | 복사 | 기본 실행 --numworkers 256 |
| os 동기화 | 객체 IAD에 대한 NFS/File PHX | 2m48.742s | NA | --parallel-operations-count 1000 |
| 복제 | 객체 IAD에 대한 NFS/File PHX | 1m52.886s | 복사 | --transfers=500 --oos-no-check-bucket --no-check-dest |
주: 테스트 결과
s5cmd가 이 데이터 집합에 가장 적합한 성능을 보였습니다.
테스트 환경 2:
VM 인스턴스: 각 테스트에 2개의 VM 인스턴스가 사용되었습니다. OCPU 24개, 네트워크 대역폭 24Gbps, 메모리 384GB가 포함된 VM.Standard.E4.Flex를 사용했습니다. Oracle Linux 8은 Linux 테스트에 사용되었습니다. Flexify IO는 VM 인스턴스를 사용하지 않습니다.
테스트에 사용된 데이터 세트: 총 2.25TiB의 파일 수 및 크기가 다음과 같은 기본 디렉토리 14개
| 데이터 세트 디렉토리 | 크기 | 파일 개수 | 각 파일의 크기 |
|---|---|---|---|
| 디렉토리 1 | 107.658 GiB | 110,242 | MiB 1개 |
| 디렉토리 2 | 1.687 GiB | 110,569 | MiB 15개 |
| 디렉토리 3 | 222 GiB | 111 | 2 GiB |
| 디렉토리 4 | 1.265 TiB | 1,295 | 1 GiB |
| 디렉토리 5 | 26.359 GiB | 1,687 | MiB 16개 |
| 디렉토리 6 | 105.281 MiB | 26,952 | 4 KiB |
| 디렉토리 7 | 29.697 MiB | 30,410 | 1 KiB |
| 디렉토리 8 | 83.124 GiB | 340,488 | 256 KiB |
| 디렉토리 9 | 21.662 GiB | 354,909 | 64 KiB |
| 디렉토리 10 | 142.629 GiB | 36,514 | MiB 4개 |
| 디렉토리 11 | 452.328 MiB | 57,898 | 8 MiB |
| 디렉토리 12 | 144 GiB | 72 | 2GiB |
| 디렉토리 13 | 208.500 GiB | 834 | 256 MiB |
| 디렉토리 14 | 54.688 GiB | 875 | 64 MiB |
참고:
- 해당하는 경우 2개의 VM 인스턴스 간에 14개의 디렉토리가 분할되었습니다.
- 각 VM은 달리 명시되지 않는 한 각 디렉토리에 대해 7개의 명령/프로세스를 실행했습니다.
| 방법 | 종료-시작 | 시간 | 명령 | 플래그/ 노트 |
|---|---|---|---|---|
| s5cmd | 객체 IAD에 대한 NFS/File PHX | 54m41.814s | 복사 | --numworkers 74 |
| os 동기화 | 객체 IAD에 대한 NFS/File PHX | 65m43.200s | NA | --parallel-operations-count 50 |
| 복제 | 객체 IAD에 대한 NFS/File PHX | 111m59.704s | 복사 | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 50 |
| 복제 | 객체 PHX - 객체 IAD | 28m55.663s | 복사 | --oos-no-check-bucket --no-check-dest --ignore-checksum --oos-disable-checksum --transfers 400, 800 전송의 동시성을 위해 2개의 VM에서 동일한 명령 실행 |
| python 대량 복사 스크립트 | 객체 PHX - 객체 IAD | 25m43.715s | 기본 | VM 1개, 작업자 50명, 한 번에 100,000개 파일 대기 |
| IO 유연성 | 객체 PHX - 객체 IAD | 20m27s | 복사 | 기본값은 10개 엔진/슬롯입니다. |
| IO 유연성 | 객체 PHX - 객체 IAD | 16m12s | 복사 | 20 엔진/슬롯, 이것은 "고급 설정"을 통해 올릴 수 있습니다 |
s5cmd 및 os sync 명령은 파일 시스템/NFS에서 오브젝트 스토리지로 잘 작동합니다. IO 및 대량 복사 스크립트는 오브젝트 스토리지(버킷 간) 전송에만 초점을 맞추고 NFS 마이그레이션에 대해 테스트되지 않았습니다.
Flexify IO,rclone 및 python 대량 복사 스크립트만 영역 간 버킷 간 전송을 수행할 수 있으므로 다른 도구는 테스트되지 않았습니다. Flexify IO는 python 대량 복사 스크립트가 rclone보다 성능이 우수하여 지역 간 오브젝트 스토리지 마이그레이션에 가장 적합합니다. Flexify IO는 S3 호환 객체 스토리지에서 작동하고, python 대량 복사 스크립트는 OCI 객체 스토리지에서만 작동하며, rclone는 많은 백엔드 및 클라우드 공급자를 지원합니다.
소규모 테스트 실행은 rclone를 사용하여 Microsoft Azure Blob Storage, Amazon Simple Storage Service(Amazon S3) 및 Google Cloud Platform Cloud Storage에서 OCI Object Storage로 데이터를 전송하여 이러한 유형의 전송에 대해 도구가 작동하는지 확인했습니다. 자세한 내용은 Rclone을 사용하여 클라우드에서 오브젝트 스토리지로 데이터 이동을 참조하십시오.
FlexifyIO는 AWS us-east-2에서 OCI 애슈번 지역으로 이 데이터 세트를 마이그레이션하는 데 사용되었으며, 기본값인 10개의 엔진/슬롯을 사용하여 2.25TiB에 대해 23m51s만 사용했으며, 더 빠른 성능을 위해 엔진/슬롯을 추가할 수 있었습니다.
테스트 환경 3:
VM 인스턴스: 각 테스트에 1~2개의 VM 인스턴스가 사용되었고, 24개의 OCPU, 24Gbps 네트워크 대역폭, 384GB 메모리가 있는 VM.Standard.E4.Flex를 사용했습니다. Oracle Linux 8은 Linux 테스트에 사용되었습니다. 모든 테스트는 버킷 대 버킷이었습니다. Flexify IO는 VM 인스턴스를 사용하지 않습니다.
| 총 크기 | 파일 수 | 파일 크기 범위 |
|---|---|---|
| 7.74 TiB | 1,000,000 | MiB 30개 |
| 방법 | 종료-시작 | 시간 | 명령 | 플래그 | 참고 | |
|---|---|---|---|---|---|---|
| 복제 | 객체-객체 IAD -> IAD | 18h39m11.4s | 복사 | --oos-no-check-bucket --fast-list --no-traverse --transfers 500 --oos-chunk-size 10Mi |
1개의 VM, 높은 파일 수 및 소스 호출 나열로 인해 매우 느림 | |
| 복제 | 객체-객체 IAD -> IAD | 55m8.431s | 복사 | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
VM 2개, VM당 500개 전송, 객체/파일 목록은 한 번에 1,000개 파일을 제공하고, 소스 및 대상에 대한 나열을 방지하며, 성능 향상 | |
| python 대량 복사 스크립트 | 객체-객체 IAD -> IAD | 28m21.013s | NA | 기본 | VM 1개, 작업자 50명, 한 번에 100,000개 파일 대기 | |
| python 대량 복사 스크립트 | 객체-객체 IAD -> IAD | NA | NA | 기본 | VM 2개, VM당 워커 50명, 한 번에 100,000개 파일 대기 429개의 오류가 수신되었으며 스크립트가 정지되어 완료할 수 없습니다. | |
| IO 유연성 | 객체-객체 IAD -> IAD | 39m19s | 복사 | 기본 | 기본값은 10개 엔진/슬롯입니다. | |
| IO 유연성 | 객체-객체 IAD -> IAD | 21m37s | 복사 | 20개의 엔진/슬롯 | 엔진/슬롯 20개로 설정, "고급 설정"을 통해 올릴 수 있습니다 | |
| s5cmd | 객체-객체 IAD -> IAD | 14m10.864s | 복사 | 기본값(256명의 근로자) | 1 VM | NA |
| s5cmd | 객체-객체 IAD -> IAD | 7m50.013s | 복사 | 기본값 | VM 2개, 각 VM 256명의 작업자 | VM 1개로 절반 이상 실행 |
| s5cmd | 객체-객체 IAD -> IAD | 3m23.382s | 복사 | --numworkers 1000 |
VM 1개, 작업자 1000명 | 여러 테스트에서 s5cmd를 사용하여 이 데이터 세트에 대해 최적의 실행임을 발견했습니다. |
| 복제 | 객체-객체 IAD -> PHX | 184m36.536s | 복사 | --oos-no-check-bucket --no-traverse --transfers 500 --oos-chunk-size 10Mi --files-from <file> |
VM 2개, VM당 전송 500개, 객체/파일 목록은 한 번에 파일 1,000개 제공 | |
| python 대량 복사 스크립트 | 객체-객체 IAD -> PHX | 35m31.633s | NA | 기본 | 1VM, 50명의 작업자, 한 번에 100,000개의 파일 대기 | |
| IO 유연성 | 객체-객체 IAD -> PHX | 21m17s | 복사 | 20개의 엔진/슬롯 | 엔진/슬롯 20개로 설정, "고급 설정"을 통해 올릴 수 있습니다 |
s5cmd 명령은 큰 파일 수와 작은 파일에 대해 일관되게 실행되었습니다. s5cmd는 동일한 테넌시 및 동일한 리전 내에서만 버킷 간 복사본을 수행할 수 있으므로 제한됩니다.
Flexify IO는 잘 작동하고 다양한 S3 호환 객체 스토리지 유형을 지원하므로 이 마이그레이션 데이터 세트에 권장되는 도구입니다. Flexify IO에 대한 엔진/슬롯 수를 늘린 후 마이그레이션 시간이 감소했습니다.
파일이 명령에 공급되고 다른 VM으로 확장되는 경우 rclone가 크게 향상됩니다. Rclone은 다른 도구보다 느리게 실행될 수 있지만 지원하는 다양한 플랫폼과 수행할 수 있는 마이그레이션 유형에서 가장 다양합니다.
OCI Object Storage Bulk Copy Python API는 OCI Native CopyObject API만 사용할 수 있으며 제한되기 전에 50명의 작업자 동시성만 얻을 수 있습니다. 일반적으로 이 데이터 세트에 매우 적합합니다.
IAD에서 PHX로의 테스트는 IAD에서 IAD로 가장 잘 작동하는 것에 대해서만 수행되었으며 문제가 있는 테스트는 다시 실행되지 않았습니다. IAD에서 PHX로의 s5cmd는 동일한 리전 내에서만 버킷 간 복사를 수행할 수 있기 때문에 실행되지 않았습니다.
관련 링크
-
자습서 3: OCI Object Storage Sync 및 S5cmd를 사용하여 OCI 클라우드 스토리지 서비스로 데이터 이동
-
자습서 4: 파일 시스템 데이터 마이그레이션을 위해 Fpsync 및 Rsync를 사용하여 OCI 클라우드 스토리지 서비스로 데이터 이동
-
대량 작업에 Oracle Cloud Infrastructure Object Storage Python 유틸리티 사용
승인
-
Authors - Vinoth Krishnamurthy(OCI File Storage 기술 담당 수석 멤버), Melinda Centeno(OCI Object Storage 수석 제품 관리자)
-
제공업체 - Aboo Valappil(기술 담당자, OCI 파일 및 블록 스토리지 컨설팅 멤버), Ashutosh Mate(OCI Object Storage 수석 제품 관리자)
추가 학습 자원
docs.oracle.com/learn에서 다른 랩을 탐색하거나 Oracle Learning YouTube 채널에서 더 많은 무료 학습 콘텐츠에 액세스하세요. 또한 education.oracle.com/learning-explorer를 방문하여 Oracle Learning Explorer가 되십시오.
제품 설명서는 Oracle Help Center를 참조하십시오.
Use Migration Tools to Move Data into OCI Cloud Storage Services
G25557-02