솔루션 패턴 선택 고려 사항

클라우드에 데이터 레이크를 구현할 때는 현재의 데이터 레이크를 Oracle Cloud로 마이그레이션하기 위한 권장 설계 패턴을 고려해 보십시오.

이전 프로젝트 준비

데이터를 Oracle Cloud로 마이그레이션할 때 프로젝트와 인력을 계획해야 합니다. 솔루션 패턴을 선택하기 전에 네트워킹 및 스토리지에 대한 정보를 수집하고 장점과 단점을 비교해 보십시오. 마이그레이션 범위에서 시스템 및 응용 프로그램에 대한 자세한 설명을 만듭니다.

사용자의 환경, 일정 및 팀 기술 수준에 기반한 권장 사항을 고려하십시오.

프로젝트 및 범위를 계획합니다. 프로젝트 관리자, 애플리케이션 소유자, 빅 데이터 엔지니어, 인프라 및 보안용 OCI 엔지니어, 개발자 등을 포함한 프로젝트 팀을 식별합니다. 응용 프로그램 개발자와 성능 및 테스트 엔지니어가 포함되었는지 확인합니다. 주요 날짜와 프로젝트 중요도를 결정합니다.

다음 예를 사용하여 시스템 및 응용 프로그램에 대한 자세한 설명을 만듭니다.

구성요소 설명
Big Data 어플라이언스(BDA)

CDH 배포를 사용하여 BDA 어플라이언스 실행

24 노드 BDA (6x Dev, 6x DR, 12x Prod)

  • 22코어 Xeon 2개
  • 2x40 IB, 4x10 이더넷
  • 96TB 디스크 및 256GB RAM
사용량
  • 300TB HDFS(500GB/일)
  • 30% CPU
  • 1TB RAM
  • 온라인 24x7
환경

운영, 개발, 재해 복구

솔루션 구성요소
  • Hive
  • HBase
  • HDFS
  • Spark(Scala)
  • Kerberos 및 Active Directory
  • Sqoop
  • Oozie
  • 분석: OBIEE
  • 외부 소스에 연결하기 위한 JDBC 드라이버

네트워킹 및 스토리지에 대한 고려 사항

데이터 레이크 마이그레이션을 계획할 때는 모든 네트워킹 및 스토리지 자산에 대한 정보를 수집하고 데이터를 OCI로 이전하는 데 가장 적합한 방법을 결정하십시오.

다음 표에서는 OCI의 데이터 마이그레이션 옵션에 대한 일반적인 상위 레벨 지침을 제공합니다.

이전 출처 데이터 볼륨 < 1TB 1TB에서 50TB 사이의 데이터 볼륨 데이터 볼륨 > 50TB
Big Data Appliance(BDA) 또는 온프레미스 자율 관리 Hadoop 클러스터

하드웨어 VPN 터널

(FastConnect를 사용할 수 없는 경우)

FastConnect(기본)

대역폭이 100 Mbps보다 큰 경우 하드웨어 VPN 터널을 사용할 수 있습니다.
데이터 전송 어플라이언스
Big Data Cloud Service(BDCS) 소프트웨어 VPN 터널

조직 요구사항 및 제약 조건에 따라 이러한 옵션 중 하나를 선택합니다. 데이터 전송에 필요한 시간은 선택한 마이그레이션 방법에 따라 달라집니다.

  • 단일 데이터 전송 어플라이언스를 사용하는 오프라인 전송의 경우 한 번에 최대 150TB의 데이터와 각 데이터 전송 작업에 대한 여러 어플라이언스를 전송할 수 있습니다. 배송 시간을 포함하면 마이그레이션을 완료하는 데 며칠이 걸립니다.
  • VPN 터널 또는 FastConnect를 사용하여 인터넷을 통한 온라인 데이터 전송의 경우 이 공식을 사용하여 필요한 대략적인 시간을 얻을 수 있습니다.

    Number of days = (Total Bytes)/(Megabits per second * 125 * 1000 * Network Utilization * 60 seconds * 60 minutes * 24 hours)

    이 공식을 사용하여 네트워크 사용률 100%를 가진 1Gbps FastConnect 연결을 통해 최대 50TB의 데이터를 전송하는 경우 데이터 전송은 6일 내에 완료됩니다. 구성된 경우에도 하위 볼륨에 FastConnect를 사용할 수 있습니다. 10Gbps FastConnect를 통해 이 작업의 시간은 1/10이 됩니다.

  • VPN 터널이 10 Mbps 연결로 1TB를 전송하고 네트워크 사용률이 80%인 경우 데이터 전송은 13일 정도 걸립니다. 또는 네트워크 연결이 이보다 낮거나 안정적이지 않을 경우 데이터 전송 어플라이언스를 사용하십시오.

다음 표에서는 접속 대역폭과 데이터 집합의 크기에 따라 OCI로의 대략적인 데이터 업로드 시간을 보여줍니다.

데이터 집합 크기 10 Mbps 100 Mbps 1Gbps 10Gbps 데이터 전송 서비스
10TB 92일 9일 22시간 2시간 1주
100TB 1,018일 101일 10일 24시간 1주
500TB 5,092일 509일 50일 5일 1주
1PB 10,185일 1,018일 101일 10일 2주

솔루션 아키텍처 설계

솔루션 패턴을 계획할 때는 결정을 내리기 전에 다음 테이블의 장점과 단점을 고려하십시오.

솔루션 패턴 장점 단점
클라우드 네이티브 (녹색)
  • 미래 호환성을 제공하는 최신 스택으로 전환할 수 있습니다.
  • 지속적인 운영 및 관리 부담 최소화
  • 대부분의 고객에게 최대 ROI(투자수익률) 및 최저 비용 옵션 제공
  • 특정 구성 요소를 자체 구현해야 하는 기능에는 약간의 차이가 있을 수 있습니다.
  • 다른 일부 패턴보다는 구현에 더 많은 작업 필요
빅 데이터 서비스(그린필드)
  • 매니지드 데이터 및 AI 서비스 사용으로 인한 비용 및 운영 오버헤드 감소 효과
  • Oracle Cloud로 전환하면 장기적이고 단기적인 솔루션으로 작업 가능
  • 다른 일부 패턴보다는 구현에 더 많은 작업 필요
재구축(이전)
  • 미래 호환성을 제공하는 최신 스택으로 전환할 수 있습니다.
  • 지속적인 운영 및 관리 부담 최소화
  • 대부분의 고객에게 최대 ROI 및 최저 비용 옵션 제공
  • 일부 구성 요소를 자체 구현해야 하는 기능에는 약간의 차이가 있을 수 있습니다.
  • 다른 일부 패턴보다는 구현에 더 많은 작업 필요
재구성(마이그레이션)
  • 매니지드 데이터 및 AI 서비스 사용으로 인한 비용 및 운영 오버헤드 감소 효과
  • Oracle Cloud로 전환할 때 장기적 솔루션 및 단기 솔루션 사용
  • 다른 일부 패턴보다는 구현에 더 많은 작업 필요
재호스트(마이그레이션)
  • 기능 중단 최소화
  • 사용 관점에서 학습할 새로운 기능 없음
  • 운영 및 지원에 대한 책임 증가
  • 기존 라이센스가 적합하지 않을 수 있습니다.

솔루션 패턴 선택에 대한 검토 기준

조직에 사용할 가장 적합한 패턴을 결정하려는 경우 다음 기준을 고려하십시오. 상대 수준의 현대화, ROI(Return-on-Investment) 및 TCO(Total Cost of Ownership) 절감, 간편한 구현, 지속적인 비용, 운영 효율성, 탄력성, 확장성, 가용성 및 기존 코드에 대한 상대적 변화와 같은 기준을 고려하십시오.

다음 표에는 조직의 요구 사항을 충족하는 패턴을 결정하는 데 도움이 되는 몇 가지 상위 레벨 기준이 나열되어 있습니다.

솔루션 패턴 상대적 현대화도 ROI 및 TCO 절감에 대한 상대적 잠재력 상대적 용이성 및 구현 기간 지속적인 비용 절감, 운영 효율성 상대적 탄력성, 확장성 및 가용성 기존 코드 및 워크플로우에 대한 상대 변경
클라우드 네이티브 (녹색) 높음 (최고) 높음 (최고) 중간 (더 우수) 높음 (최고) 높음 (최고) 해당 없음
빅 데이터 서비스(그린필드) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수) 해당 없음
재구축(이전) 높음 (최고) 높음 (최고) 낮음 (양호) 높음 (최고) 높음 (최고) 높음 (양호)
재구성(마이그레이션) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수) 중간 (더 우수)
재호스트(마이그레이션) 낮음 (양호) 낮음 (양호) 높음 (최고) 낮음 (양호) 낮음 (양호) 낮음 (최고)

Oracle은 사용자의 환경 요구 사항, 일정 및 팀 기술에 따라 요구 사항에 가장 적합한 패턴을 사용할 것을 권장합니다.

조직에 가장 적합한 솔루션을 결정할 때는 다음 사항을 고려하십시오.

  • 많은 고객이 클라우드 도입 여정에서 두 개 이상의 패턴을 사용합니다.
  • 실제 순위는 특정 고객 컨텍스트와 사용 사례에 따라 달라집니다.
  • 고객의 모든 요구 사항에 맞는 단일 패턴은 없습니다.
  • 추가 기준에는 고객 선호도, 전문 지식, 고유한 요구사항이 포함됩니다.