데이터 플랫폼 - LOB(현업 부서)용 부서별 데이터 웨어하우스

Oracle Autonomous Data WarehouseOracle Analytics Cloud를 사용하여 Oracle E-Business Suite, 스프레드시트, 타사 및 기타 소스의 데이터를 중앙 집중식 데이터 웨어하우스로 로드 및 최적화하여 부서에서 데이터를 분석하고 실행 가능한 통찰력을 얻을 수 있습니다.

이 참조 아키텍처는 전체 비즈니스 컨텍스트 내에서 기술 솔루션을 포지셔닝합니다:



일반적으로 업무 라인에는 데이터 및 정보에 대한 적시 또는 효율적인 액세스가 없습니다. 분석가는 데이터를 수동으로 수집하고 개별적으로 작업한 다음 전자 메일 또는 파일 서버를 통해 파일 복사본을 공유합니다. 데이터는 중앙 집중화되지 않으므로 데이터의 정확성과 보안이 어렵습니다. 분석은 시간이 오래 걸릴 수 있으며 결과를 쉽게 반복할 수 없습니다.

부서별 데이터 웨어하우스는 판매, 마케팅 또는 재무와 같은 단일 주제 또는 기능 영역에 초점을 맞춘 단순한 형태의 데이터 웨어하우스이며 종종 조직 내의 단일 부서에 의해 구축 및 제어됩니다. 단일 주체 포커스를 고려할 때 부서별 데이터 웨어하우스는 일반적으로 소수의 소스에서만 데이터를 가져옵니다. 소스에는 내부 시스템, 중앙 데이터 웨어하우스 또는 외부 데이터가 포함될 수 있습니다.

관리되는 엔터프라이즈 및 부서별 데이터 웨어하우스는 IT 리소스 및 가용성에 크게 의존하지 않고 비즈니스 사용자에게 풍부한 정보를 제공하고 조직의 주요 성과 지표를 보다 효과적으로 제공할 수 있습니다.

구조

이 구조는 Oracle Autonomous Data Warehouse를 사용하여 여러 재무 시스템, 스프레드시트 및 기타 데이터 소스에서 중앙 집중식 데이터 웨어하우스로 데이터를 로드 및 최적화한 다음 Oracle Analytics Cloud를 사용하여 실행 가능한 인사이트를 제공합니다.

이 아키텍처는 여러 사용 사례를 지원합니다. 가장 직접적인 경로는 Oracle Autonomous Data Warehouse(ADW)에 내장된 툴을 사용하여 데이터를 수집, 변환 및 데이터 웨어하우스로 로드하는 간단한 방법을 제공합니다. 다른 경로는 ETL(추출, 변환 및 로드) 요구사항이 더 복잡한 데이터 레이크 또는 시나리오를 사용하는 시나리오를 지원합니다.


data-platform-ebs.png에 대한 설명은 다음과 같습니다.
그림 데이터 플랫폼 설명-ebs.png

데이터 플랫폼-ebs-oracle.zip

이 구조는 다음 논리적 부문에 중점을 둡니다:

  • 수집, 변환, 연결

    아키텍처의 각 데이터 계층에서 사용할 데이터를 수집하고 세분화합니다.

  • 유지, 선별, 생성

    현재 비즈니스 뷰를 표시하도록 데이터 액세스 및 탐색을 지원합니다. 관계형 기술의 경우 데이터는 단순한 관계형, 경도, 치수 또는 OLAP 형태로 논리적이거나 물리적으로 구조화될 수 있습니다. 비관계형 데이터의 경우 이 계층에는 분석 프로세스의 출력 또는 특정 분석 작업에 최적화된 데이터 중 하나 이상의 데이터 풀이 포함됩니다.

  • 분석, 학습, 예측

    소비자에 대한 데이터의 논리적 비즈니스 뷰를 요약합니다. 이 추상화는 개발, 대상 아키텍처로의 마이그레이션 및 여러 통합 소스에서 단일 보고 계층의 프로비저닝에 대한 기민한 접근법을 지원합니다.

다음 다이어그램은 기본 보안으로 Oracle Cloud Infrastructure에 제공된 서비스에 대한 아키텍처 매핑을 보여줍니다.



oci-adb-oac-arch-public-oracle.zip

이 구조에는 다음과 같은 구성 요소가 있습니다.

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse는 데이터 웨어하우징 작업 로드에 최적화된 자율 구동, 자율 보안, 자율 복구 데이터베이스 서비스입니다. 하드웨어를 구성 또는 관리하거나 소프트웨어를 설치할 필요가 없습니다. Oracle Cloud Infrastructure는 데이터베이스 생성과 데이터베이스 백업, 패치 적용, 업그레이드 및 튜닝을 처리합니다.

  • 분석

    Oracle Analytics Cloud는 확장 가능하고 안전한 공용 클라우드 서비스로, 사용자, 작업 그룹 및 엔터프라이즈에 대해 공동 작업 분석을 탐색하고 수행할 수 있는 전체 기능을 제공합니다.

    Oracle Analytics Cloud를 사용하면 빠른 설정, 간편한 확장 및 패치 적용, 자동화된 수명 주기 관리 등의 유연한 서비스 관리 기능도 얻을 수 있습니다.

  • 데이터 통합

    Oracle Autonomous Data Warehouse 에는 여러 부서별 시나리오에 대한 데이터를 획득, 로드 및 변환하는 툴이 포함되어 있습니다.

    고급 사용 사례의 경우 Oracle Cloud Infrastructure Data Integration(완전히 관리되는 서버리스 고유 클라우드 서비스) 을 사용하여 여러 소스의 데이터 수집, 정리, 변환 및 모양 변경, Oracle Cloud Infrastructure의 대상 데이터 소스에 효율적으로 로드하는 것과 같은 일반적인 ETL(추출, 로드 및 변환) 작업을 수행할 수 있습니다.

이 구조에는 다음 구성 요소도 포함됩니다.
  • 지역

    Oracle Cloud Infrastructure 지역은 가용성 도메인이라고 하는 하나 이상의 데이터 센터를 포함하는 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며 거리가 멀면 국가 또는 대륙을 가로질러 분리할 수 있습니다.

  • 구획

    구획은 Oracle Cloud Infrastructure 테넌시 내의 지역 간 논리적 분할 영역입니다. 구획을 사용하여 Oracle Cloud에서 리소스를 구성하고, 리소스에 대한 액세스를 제어하며, 사용 할당량을 설정합니다. 지정된 구획의 리소스에 대한 액세스를 제어하기 위해 리소스에 액세스할 수 있는 사용자와 수행할 수 있는 작업을 지정하는 정책을 정의합니다.

  • IAM(ID 및 액세스 관리)

    Oracle Cloud Infrastructure Identity and Access Management(IAM)는 Oracle Cloud Infrastructure(OCI) 및 Oracle Cloud Applications의 액세스 제어 플레인입니다. IAM API 및 사용자 인터페이스를 통해 ID 도메인과 ID 도메인 내의 리소스를 관리할 수 있습니다. 각 OCI IAM ID 도메인은 독립형 ID 및 액세스 관리 솔루션 또는 다른 사용자 모집단을 나타냅니다.

  • 정책

    Oracle Cloud Infrastructure Identity and Access Management 정책은 어떤 리소스에 접근할 수 있는지와 방법을 지정합니다. 액세스는 그룹 및 구획 레벨에서 부여됩니다. 즉, 특정 구획 내에서 또는 테넌시에 특정 유형의 액세스 권한을 그룹에 부여하는 정책을 작성할 수 있습니다.

  • 가용성 도메인

    가용성 도메인은 한 지역 내에 있는 독립형 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 내결함성을 제공하는 다른 가용성 도메인의 리소스와 격리됩니다. 가용성 도메인은 전원, 냉각 또는 내부 가용성 도메인 네트워크와 같은 인프라를 공유하지 않습니다. 따라서 특정 가용성 도메인에서 장애가 발생하면 해당 지역의 다른 가용성 도메인에 영향을 주지 않습니다.

  • VCN(가상 클라우드 네트워크) 및 서브넷

    VCN은 Oracle Cloud Infrastructure 지역에서 설정한 커스터마이징 가능한 소프트웨어 정의 네트워크입니다. 기존 데이터 센터 네트워크와 마찬가지로 VCN은 네트워크 환경을 완벽하게 제어할 수 있습니다. VCN에는 VCN 생성 후 변경할 수 있는 겹치지 않는 여러 CIDR 블록이 있을 수 있습니다. VCN을 서브넷으로 세그먼트할 수 있으며, 지역 또는 가용성 도메인으로 범위를 지정할 수 있습니다. 각 서브넷은 VCN의 다른 서브넷과 겹치지 않는 연속된 주소 범위로 구성됩니다. 생성 후 서브넷의 크기를 변경할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.

  • 보안 목록

    각 서브넷에 대해 서브넷에 들어오고 나가야 하는 트래픽의 소스, 대상 및 유형을 지정하는 보안 규칙을 생성할 수 있습니다.

  • 경로 테이블

    가상 라우팅 테이블에는 일반적으로 게이트웨이를 통해 서브넷에서 VCN 외부의 대상으로 트래픽을 라우팅하는 규칙이 포함됩니다.

  • 인터넷 게이트웨이

    인터넷 게이트웨이는 VCN의 공용 서브넷과 공용 인터넷 간의 트래픽을 허용합니다.

  • 사이트 간 VPN

    사이트 간 VPN은 온프레미스 네트워크와 Oracle Cloud Infrastructure의 VCN 간 IPSec VPN 연결을 제공합니다. IPSec 프로토콜 제품군은 패킷이 소스에서 대상으로 전송되기 전에 IP 트래픽을 암호화하고 도착 시 트래픽을 해독합니다.

  • DRG(Dynamic routing gateway)

    DRG는 VCN과 지역 외부 네트워크(예: 다른 Oracle Cloud Infrastructure 지역 내 VCN, 온프레미스 네트워크 또는 다른 클라우드 제공업체의 네트워크) 간 동일한 지역의 VCN 간 전용 네트워크 트래픽 경로를 제공하는 가상 라우터입니다.

  • NAT(Network Address Translation) 게이트웨이

    NAT 게이트웨이를 사용하면 VCN의 전용 리소스가 수신 인터넷 연결에 이러한 리소스를 노출시키지 않고 인터넷의 호스트에 접근할 수 있습니다.

  • 서비스 게이트웨이

    서비스 게이트웨이는 VCN에서 Oracle Cloud Infrastructure Object Storage와 같은 다른 서비스로의 접근을 제공합니다. VCN에서 Oracle 서비스로의 트래픽은 Oracle 네트워크 패브릭을 통해 이동하며 인터넷을 순회하지 않습니다.

  • NSG(Network Security Group)

    NSG(네트워크 보안 그룹)는 클라우드 리소스에 대한 가상 방화벽 역할을 합니다. Oracle Cloud Infrastructure의 제로 트러스트 보안 모델을 사용하면 모든 트래픽이 거부되며 VCN 내의 네트워크 트래픽을 제어할 수 있습니다. NSG는 단일 VCN의 지정된 VNIC 집합에만 적용되는 수신 및 송신 보안 규칙 집합으로 구성됩니다.

  • 객체 스토리지

    오브젝트 스토리지를 사용하면 데이터베이스 백업, 애널리틱스 데이터, 이미지 및 비디오와 같은 풍부한 컨텐츠를 비롯하여 모든 컨텐츠 유형의 구조적 및 비구조적 데이터에 신속하게 접근할 수 있습니다. 인터넷 또는 클라우드 플랫폼 내에서 직접 안전하게 데이터를 저장하고 검색할 수 있습니다. 성능 또는 서비스 신뢰성의 저하를 경험하지 않고도 스토리지를 원활하게 확장할 수 있습니다. 빠르고 즉각적이며 자주 액세스하는 데 필요한 "핫" 스토리지에 표준 스토리지를 사용합니다. 장기간 보존하고 거의 액세스하지 않는 "콜드" 스토리지에 아카이브 스토리지를 사용합니다.

권장 사항

다음 권장 사항을 시작점으로 사용하여 분석을 위해 여러 플랫 파일 소스에서 중앙 데이터 웨어하우스 위치로 데이터를 로드하고 최적화합니다.

요구 사항은 여기에 설명된 아키텍처와 다를 수 있습니다.

  • Data Refinery

    Autonomous Database Tools는 Oracle Autonomous Data Warehouse에 내장되어 있으며 간단한 방식으로 로드, 변환, 카탈로그화, 인사이트 확보, 비즈니스 모델 개발 등의 기능을 제공합니다. 이러한 도구는 Database Actions 메뉴에서 찾을 수 있습니다.

  • Oracle Analytics Cloud

    Oracle Analytics CloudOracle Autonomous Data Warehouse에 연결하기 전에 데이터베이스 관리자가 허용된 주소 목록에 Oracle Analytics Cloud 인스턴스에 대한 IP 주소(또는 주소 범위)를 추가하도록 합니다. 데이터베이스 관리자는 Oracle Analytics Cloud에서 데이터베이스로 TCP/IP 트래픽을 허용하는 보안 규칙을 추가해야 합니다.

고려 사항

분석을 위해 여러 플랫 파일 소스에서 중앙 데이터 웨어하우스 위치로 데이터를 로드하고 최적화하는 경우 다음 구현 옵션을 고려하십시오.

Guidance Data Refinery 데이터 지속성 플랫폼 액세스 및 해석
권장사항 Oracle Autonomous Database Tools(데이터베이스 작업) Oracle Autonomous Data Warehouse Oracle Analytics Cloud
기타 옵션 Oracle Cloud Infrastructure 데이터 통합 Oracle Exadata Database Service입니다.  
근거 Oracle Autonomous Data Warehouse는 CSV 파일 및 관계형 데이터 소스와 같은 다양한 데이터 소스에 대한 직접 액세스 및 수집을 제공하는 사용하기 쉬운 완전 자율운영 데이터베이스입니다. Oracle Autonomous Data Warehouse는 탄력적으로 확장되고 빠른 질의 성능을 제공하며 데이터베이스 관리가 필요하지 않은 사용하기 쉬운 완전한 자율운영 데이터베이스입니다. 또한 외부 테이블을 통해 오브젝트 스토리지의 데이터에 직접 액세스할 수 있습니다. Oracle Analytics Cloud는 전담 관리되며 선별된 데이터 계층(Oracle Autonomous Data Warehouse)과 긴밀하게 통합됩니다.

배치

이 참조 구조에 대한 Terraform 코드는 GitHub에서 사용할 수 있습니다. 한 번의 클릭으로 코드를 Oracle Cloud Infrastructure Resource Manager로 가져와서 스택을 생성하고 배치할 수 있습니다. 또는 GitHub에서 컴퓨터로 코드를 다운로드하고, 코드를 사용자정의하고, Terraform CLI(명령행 인터페이스) 를 사용하여 구조를 배치할 수 있습니다.

  • Oracle Cloud Infrastructure Resource Manager를 사용하여 배치:
    1. Oracle Cloud에 배치누릅니다.

      아직 사인인하지 않은 경우 테넌시 및 사용자 인증서를 입력합니다.

    2. 조건 및 조항을 검토하고 동의합니다.
    3. 스택을 배치하고자 하는 영역을 선택하십시오.
    4. 화면 프롬프트 및 지침에 따라 스택을 만듭니다.
    5. 스택을 생성한 후 Terraform 작업 을 누르고 계획 을 선택합니다.
    6. 작업이 완료될 때까지 기다렸다가 계획을 검토하십시오.

      변경하려면 스택 세부 정보 페이지로 돌아가서 스택 편집 을 누르고 필요에 따라 변경합니다. 그런 다음 계획 작업을 다시 실행합니다.

    7. 더 이상 변경할 필요가 없는 경우 스택 세부 정보 페이지로 돌아가서 Terraform 작업 을 누르고 적용 을 선택합니다.
  • GitHub에서 Terraform 코드를 사용하여 배포합니다:
    1. GitHub으로 이동합니다.
    2. 저장소를 로컬 컴퓨터에 복제하거나 다운로드합니다.
    3. README 문서의 지침을 따릅니다.

변경 로그

이 로그에는 중요한 변경 사항만 나열됩니다: