WANdisco LiveData Migrator를 사용하여 Oracle로 Hadoop 마이그레이션
LiveData 마이그레이션기가 Hadoop 클러스터의 에지 노드에 배치됩니다. 현재 운용 작업에 영향을 주지 않고 몇 분 내에 배치가 수행됩니다. 사용자는 명령행, REST API 또는 UI(사용자 인터페이스)를 사용하여 즉시 제품을 사용하여 마이그레이션을 수행할 수 있습니다.
Hadoop 데이터 이전 정보
다음은 Apache Hadoop에서 클라우드로 마이그레이션하는 일반적인 단계입니다.
다음 다이어그램은 플로우 구조 및 구성 요소를 보여줍니다.

그림 hadoop-lakehouse-migration.png에 대한 설명
hadoop-lakehouse-migration-oracle.zip
- 검색: 클라우드로 마이그레이션할 데이터 세트 및 워크로드를 식별합니다.
- 계획: 이전이 수행될 단계에 대한 계획 및 타임라인을 개발합니다.
- 데이터 마이그레이션: 필요한 데이터를 온프레미스 Hadoop 환경에서 클라우드로 마이그레이션합니다.
- 작업 로드 이전: 온프레미스 환경에서 클라우드로 작업 로드 및/또는 애플리케이션을 이전합니다.
- 새로운 분석 개발: 새로운 분석, AI 및 머신 러닝을 개발하기 시작하면서 새로운 클라우드 환경을 활용합니다.
- 측정 및 실행: 분석을 수행하여 KPI를 측정하고 성과를 평가하며 예측을 수행하며 비즈니스가 적절하게 작업을 수행할 수 있도록 합니다.
클라우드 마이그레이션을 시도하고 간소화하기 위해 많은 조직은 "리프트 및 시프트" 마이그레이션 전략을 따르도록 선택합니다. 이 전략을 사용하면 데이터나 응용 프로그램을 변경하지 않고도 마이그레이션을 수행할 수 있다고 가정할 수 있습니다. 논리는 "클라우드로 이전하기만 하면 됩니다." 이러한 가정으로 인해 많은 실패한 프로젝트 또는 프로젝트가 해당 시간과 비용을 초과합니다. 기존 시스템을 중지하여 데이터 변경이 발생하지 않도록 하거나 조직에서 데이터 변경을 처리하기 위해 맞춤형 솔루션을 개발하는 데 시간을 소비해야 합니다. 이 전략의 다른 단점은 조직에서 모든 애플리케이션과 데이터에 대해 동시에 빅뱅 컷오버를 수행해야 한다는 점입니다. 둘째, 새로운 클라우드 기능을 활용하지 못합니다.
WANdisco는 데이터 레이크 마이그레이션에 대한 데이터 우선 접근 방식을 지원합니다. 데이터 우선 접근 방식은 데이터를 신속하게 이동하고 모든 기존 애플리케이션을 동시에 마이그레이션하지 않는 데 중점을 둡니다. 따라서 데이터 과학자가 데이터를 더욱 신속하게 사용할 수 있으므로 첫날부터 마이그레이션된 데이터 작업을 시작할 수 있습니다. 이를 통해 새로운 통찰력과 새로운 AI 혁신에 더욱 빠르게 도달할 수 있습니다. 조직은 클라우드 마이그레이션에 대한 ROI(투자수익률)를 훨씬 더 높이는 반면에 기존 온프레미스 운영 워크로드는 영향을 받지 않습니다. 또한 이 접근 방식은 애플리케이션 및 워크로드 마이그레이션을 위한 유연성을 제공합니다. 모든 Big-bang 접근 방식을 피하고 조직은 새로운 클라우드 환경의 워크로드를 최적화하는 시간을 제공하여 최적으로 실행되도록 보장하며 사용 가능한 새로운 기능을 활용합니다. 조직은 필요에 따라 많은 병렬 테스트를 수행하여 숨겨진 비용이 발생하지 않도록 보장할 수 있으며, 데이터 우선 접근 방식을 사용하면 일부 응용 프로그램을 전혀 마이그레이션할 필요가 없는지 판단할 수 있을 뿐만 아니라 새로 개발된 개발로 대체할 수도 있습니다.
소스 및 대상 정의
배치 중 WANdisco LiveData Migrator는 대상 환경만 정의하면 되도록 소스 Apache Hadoop HDFS(분산 파일 시스템) 클러스터를 자동으로 검색합니다.
마이그레이션 정의
이전은 기존 데이터를 소스에서 정의된 대상으로 전송합니다. WANdisco LiveData Migrator는 마이그레이션되는 동안 소스 데이터에 대한 변경 사항을 마이그레이션하고 이러한 변경 사항을 적용하여 대상이 최신 상태인지 확인합니다. 마이그레이션을 계속 수행하는 동안 이 작업을 수행합니다.
일반적으로 사용자는 소스 파일 시스템에서 경로별로 특정 컨텐츠를 선택할 수 있도록 다중 마이그레이션을 만듭니다. 여러 마이그레이션 대상을 정의하여 동시에 여러 독립 파일 시스템으로 마이그레이션할 수도 있습니다.
마이그레이션을 만들려면 마이그레이션 이름을 제공하고 소스 및 대상 파일 시스템을 선택한 다음 마이그레이션할 소스 파일 시스템의 경로를 지정합니다. 선택적으로 제외를 적용하여 마이그레이션에서 제외해야 하는 데이터에 대한 규칙을 지정하고 기타 선택적 구성 설정을 적용할 수 있습니다.
LiveData Migrator는 소스에서 대상 메타 저장소로의 Hive 메타 데이터 마이그레이션도 지원합니다. LiveData Migrator는 로컬 또는 원격 메타 데이터 에이전트를 사용하여 메타 저장소에 연결합니다. 메타데이터 규칙은 소스에서 대상으로 마이그레이션할 메타데이터를 정의하는 데 사용됩니다.
마이그레이션을 정의할 때 마이그레이션을 자동으로 시작하고 라이브 마이그레이션이어야 하는지 여부를 결정하도록 지정할 수 있습니다. 즉, 소스에서 대상으로 진행 중인 모든 변경사항을 지속적으로 적용합니다.