데이터 플랫폼 - E-Business 통합을 활용한 데이터 웨어하우스

분석가는 여러 재무 시스템, 스프레드시트 및 기타 데이터 소스의 데이터를 신뢰할 수 있고 유지보수 가능하며 쿼리 최적화 소스로 통합하는 효율적인 방법이 필요합니다.

Oracle Autonomous Data Warehouse(ADW) 및 Oracle Analytics Cloud를 사용하면 Oracle E-Business Suite 및 기타 소스의 데이터를 중앙 집중식 데이터 웨어하우스 위치에 로드하고 최적화하여 부서에서 실행 가능한 통찰력을 얻을 수 있습니다.

이 참조 아키텍처는 전체 비즈니스 컨텍스트 내에서 기술 솔루션을 포지셔닝합니다.



LOB(현업 부서)는 일반적으로 데이터 및 정보를 적시에 또는 효율적으로 액세스할 수 없습니다. 분석가는 데이터를 수동으로 수집하고, 개별적으로 작업한 다음 전자메일 또는 파일 서버를 통해 파일의 복사본을 공유합니다. 데이터는 중앙 집중화되지 않으므로 데이터 정확성 및 보안이 어렵습니다. 분석은 시간이 오래 걸릴 수 있으며 결과를 쉽게 반복할 수 없습니다.

데이터 마트는 영업, 마케팅 또는 재무와 같은 단일 주제 또는 기능 영역에 초점을 맞추고 있으며 조직 내 단일 부서에서 종종 구축 및 제어되는 단순한 형태의 데이터 웨어하우스입니다. 데이터 마트는 대개 몇 개의 소스에서만 데이터를 가져옵니다. 소스에는 내부 시스템, 중앙 데이터 웨어하우스 또는 외부 데이터가 포함될 수 있습니다.

관리되는 데이터 웨어하우스와 데이터 마트는 비즈니스 사용자에게 풍부한 정보를 제공할 수 있으며 IT 자원과 가용성에 크게 의존하지 않고도 조직의 주요 성과 지표를 보다 효과적으로 제공할 수 있습니다.

구조

이 아키텍처는 Oracle Autonomous Data Warehouse에 포함된 기능인 Data Transforms를 사용하여 여러 소스의 데이터를 중앙 집중식 Autonomous Data Warehouse로 로드하고 최적화한 다음 Oracle Analytics Cloud를 사용하여 데이터를 분석하여 실행 가능한 통찰력을 제공합니다.


다음은 data-platform-ebs.png에 대한 설명입니다.
그림 data-platform-ebs.png에 대한 설명

data-platform-ebs-oracle.zip

이 구조는 다음 논리적 분할에 중점을 둡니다.

  • 수집, 변환

    아키텍처의 각 데이터 계층에서 사용할 데이터를 수집하고 세분화합니다.

  • 유지, 선별, 생성

    데이터에 대한 접근 및 탐색을 용이하게 하여 현재 비즈니스 뷰를 표시합니다. 관계형 기술의 경우 데이터는 단순 관계형, 긴칭, 차원 또는 OLAP 형식으로 논리적 또는 물리적으로 구조화될 수 있습니다. 비관계형 데이터의 경우 이 계층에는 분석 프로세스의 출력 또는 특정 분석 작업에 최적화된 데이터 등 하나 이상의 데이터 풀이 포함되어 있습니다.

  • 분석, 학습, 예측

    소비자의 데이터에 대한 논리적 비즈니스 뷰를 추상화합니다. 이 추상화를 통해 민첩한 개발 접근 방식, 대상 아키텍처로 마이그레이션, 여러 통합 소스에서 단일 보고 계층의 프로비저닝을 원활하게 수행할 수 있습니다.

다음 다이어그램은 보안 모범사례를 사용하여 Oracle Cloud Infrastructure에 제공된 서비스에 위의 아키텍처 매핑을 보여줍니다.



oci-adb-oac-arch-oracle.zip

구조에는 다음과 같은 구성 요소가 있습니다.

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse는 데이터 웨어하우징 워크로드에 최적화된 자동 구동의 자가 보안 및 자가 복구 데이터베이스 서비스입니다. 하드웨어를 구성 또는 관리하거나 소프트웨어를 설치할 필요가 없습니다. Oracle Cloud Infrastructure는 데이터베이스 생성과 데이터베이스 백업, 패치, 업그레이드 및 조정을 처리합니다.

  • 데이터 통합

    Oracle Data Transforms는 Autonomous Database 데이터베이스 작업(DB 툴)에서 배치할 수 있는 Oracle Data Integrator(ODI) 통합 툴입니다. SOA 또는 비즈니스 인텔리전스 환경에서 복잡한 데이터 웨어하우스를 구축, 배포 및 관리하거나 데이터 중심 아키텍처의 일부로 관리할 수 있는 완전한 통합 솔루션을 제공합니다. 또한 데이터 통합, 데이터 이동, 데이터 동기화, 데이터 품질 및 데이터 관리의 모든 요소를 결합하여 복잡한 시스템 전체에서 정보가 적시에 정확하고 일관되게 유지되도록 합니다.

  • 분석

    Oracle Analytics Cloud는 확장 가능하고 안전한 퍼블릭 클라우드 서비스로, 데이터 준비, 시각화, 엔터프라이즈 보고, 증강 분석, 자연어 처리 및 생성을 위한 AI 기반의 최신 셀프서비스 애널리틱스 기능을 통해 비즈니스 애널리스트의 역량을 강화합니다. Oracle Analytics Cloud를 사용하면 빠른 설정, 간편한 확장 및 패치, 자동화된 라이프사이클 관리 등 유연한 서비스 관리 기능도 이용할 수 있습니다.

이 구조에는 다음 구성 요소도 포함됩니다.

  • 지역

    Oracle Cloud Infrastructure 지역은 가용성 도메인이라고 하는 하나 이상의 데이터 센터를 포함하는 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며, 방대한 거리로 이들을 분리할 수 있습니다(국가 또는 대륙 간).

  • 구획

    구획은 Oracle Cloud Infrastructure 테넌시 내의 지역 간 논리적 파티션입니다. 구획을 사용하여 Oracle Cloud에서 리소스를 구성하고, 리소스에 대한 액세스를 제어하고, 사용 할당량을 설정합니다. 제공된 구획의 리소스에 대한 액세스를 제어하려면 리소스에 액세스할 수 있는 사용자 및 수행할 수 있는 작업을 지정하는 정책을 정의합니다.

  • ID 및 접근 관리(IAM)

    Oracle Cloud Infrastructure Identity and Access Management(IAM)는 Oracle Cloud Infrastructure(OCI) 및 Oracle Cloud Applications의 접근 제어 플레인입니다. IAM API 및 사용자 인터페이스를 통해 ID 도메인 및 ID 도메인 내의 리소스를 관리할 수 있습니다. 각 OCI IAM ID 도메인은 독립형 ID 및 액세스 관리 솔루션 또는 서로 다른 사용자 모집단을 나타냅니다.

  • 정책

    Oracle Cloud Infrastructure Identity and Access Management 정책은 어떤 리소스에 접근할 수 있는 사용자와 방법을 지정합니다. 접근 권한은 그룹 및 구획 레벨에서 부여되므로 특정 구획 또는 테넌시 내에서 그룹에 특정 유형의 접근 권한을 부여하는 정책을 작성할 수 있습니다.

  • 가용성 도메인

    가용성 도메인은 한 지역 내의 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 내결함성을 제공하는 다른 가용성 도메인의 리소스와 분리됩니다. 가용성 도메인은 전원, 냉각 등의 인프라 또는 내부 가용성 도메인 네트워크를 공유하지 않으므로 따라서 특정 가용성 도메인에서 장애가 발생해도 해당 지역의 다른 가용성 도메인에 영향을 주지 않습니다.

  • VCN(가상 클라우드 네트워크) 및 서브넷

    VCN은 Oracle Cloud Infrastructure 영역에서 설정하는 커스터마이징 가능한 소프트웨어 정의 네트워크입니다. 기존의 데이터 센터 네트워크와 마찬가지로 VCN은 네트워크 환경에 대한 완벽한 제어를 제공합니다. VCN에는 VCN을 생성한 후 변경할 수 있는 겹치지 않는 여러 CIDR 블록이 있을 수 있습니다. VCN을 서브넷으로 분할할 수 있으며, 지역 또는 가용성 도메인으로 범위가 지정될 수 있습니다. 각 서브넷은 VCN의 다른 서브넷과 겹치지 않는 연속적인 주소 범위로 구성됩니다. 서브넷을 생성한 후 크기를 변경할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.

  • 인터넷 게이트웨이

    인터넷 게이트웨이는 VCN의 공용 서브넷과 공용 인터넷 사이의 트래픽을 허용합니다.

  • 사이트 간 VPN

    사이트 간 VPN은 온프레미스 네트워크와 Oracle Cloud Infrastructure의 VCN 간에 IPSec VPN 연결을 제공합니다. IPSec 프로토콜 제품군은 패킷이 소스에서 대상으로 전송되기 전에 IP 트래픽을 암호화하고 도착 시 트래픽을 해독합니다.

  • DRG(동적 라우팅 게이트웨이)

    DRG는 VCN과 지역 외부의 네트워크(예: 다른 Oracle Cloud Infrastructure 지역의 VCN, 온프레미스 네트워크 또는 다른 클라우드 제공업체의 네트워크) 간 전용 네트워크 트래픽 경로를 제공하는 가상 라우터입니다.

  • NAT(네트워크 주소 변환) 게이트웨이

    NAT 게이트웨이를 사용하면 VCN의 전용 리소스가 수신 인터넷 연결에 리소스를 노출하지 않고도 인터넷의 호스트에 접근할 수 있습니다.

  • 서비스 게이트웨이

    서비스 게이트웨이는 VCN에서 Oracle Cloud Infrastructure Object Storage와 같은 다른 서비스에 대한 접근을 제공합니다. VCN에서 Oracle 서비스로의 트래픽은 Oracle 네트워크 패브릭을 통해 이동하며 인터넷을 경유하지 않습니다.

  • 경로 테이블

    가상 라우트 테이블에는 일반적으로 게이트웨이를 통해 서브넷에서 VCN 외부의 대상으로 트래픽을 라우팅하는 규칙이 포함됩니다.

  • 보안 목록

    각 서브넷에 대해 서브넷에 들어오고 나가야 하는 트래픽의 소스, 대상, 유형을 지정하는 보안 규칙을 생성할 수 있습니다.

  • NSG(네트워크 보안 그룹)

    NSG(네트워크 보안 그룹)는 클라우드 리소스에 대한 가상 방화벽으로 작동합니다. Oracle Cloud Infrastructure의 신뢰할 수 없는 보안 모델을 사용하면 모든 트래픽이 거부되며, VCN 내에서 네트워크 트래픽을 제어할 수 있습니다. NSG는 단일 VCN의 지정된 VNIC 집합에만 적용되는 일련의 수신 및 송신 보안 규칙으로 구성됩니다.

  • 배스천 호스트

    배스천 호스트는 클라우드 외부에서 토폴로지에 대한 보안 제어 시작점 역할을 하는 컴퓨트 인스턴스입니다. 배스천 호스트는 일반적으로 DMZ(Demilitarized Zone)에서 프로비저닝됩니다. 이를 통해 클라우드 외부에서 직접 액세스할 수 없는 개인 네트워크에 중요한 리소스를 배치하여 보호할 수 있습니다. 토폴로지에는 정기적으로 모니터하고 감사할 수 있는 알려진 단일 시작점이 있습니다. 따라서 액세스 권한을 손상시키지 않으면서 토폴로지의 보다 중요한 구성 요소가 노출되지 않도록 할 수 있습니다.

  • 객체 스토리지

    오브젝트 스토리지는 데이터베이스 백업, 애널리틱스 데이터, 이미지 및 비디오와 같은 풍부한 컨텐츠를 포함하여 모든 컨텐츠 유형의 구조적 및 비구조적 대량 데이터에 빠르게 접근할 수 있습니다. 인터넷을 통해 또는 클라우드 플랫폼 내에서 직접 안전하게 데이터를 저장하고 검색할 수 있습니다. 성능 또는 서비스 안정성이 저하되지 않으면서 스토리지를 원활하게 확장할 수 있습니다. 빠르고 즉각적이며 자주 액세스해야 하는 "핫" 스토리지에 표준 스토리지를 사용합니다. 장기간 보존하고 거의 액세스하지 않는 "콜드" 스토리지에 아카이브 스토리지를 사용합니다.

권장사항

다음 권장 사항을 출발점으로 사용하여 분석을 위해 Oracle E-Business Suite 및 기타 소스에서 중앙 집중화된 데이터 웨어하우스 위치로 데이터를 로드하고 최적화할 수 있습니다.

요구 사항은 여기에 설명된 아키텍처와 다를 수 있습니다.

  • 데이터 변환

    Oracle Autonomous Data Warehouse의 내장 서비스인 데이터 변환을 사용하면 데이터 소스와 대상 간에 매핑을 생성하여 ETL 및 E-LT 방식을 모두 사용하여 데이터를 세분화하고 정리할 수 있습니다.

  • EBS를 지원하는 데이터 통합

    Oracle E-Business Suite의 지식 모듈을 사용하면 비즈니스 응용 프로그램에서 데이터를 추출하고 Oracle Database에서 일반 매핑을 사용하여 데이터 웨어하우스에 통합할 수 있습니다.

  • Oracle Analytics Cloud

    Oracle Analytics CloudOracle Autonomous Data Warehouse에 연결하기 전에 데이터베이스 관리자가 Oracle Analytics Cloud 인스턴스의 IP 주소(또는 주소 범위)를 승인된 주소 목록에 추가하도록 합니다. 데이터베이스 관리자는 Oracle Analytics Cloud의 TCP/IP 트래픽을 데이터베이스에 허용하는 보안 규칙을 추가해야 합니다.

고려 사항

분석을 위해 Oracle E-Business Suite 및 기타 소스에서 중앙 집중화된 데이터 웨어하우스 위치로 데이터를 로드 및 최적화할 때는 다음 구현 옵션을 고려하십시오.

지도 데이터 변환 데이터 지속성 플랫폼 액세스 및 해석
권장사항 Oracle Autonomous Data Warehouse Oracle Autonomous Data Warehouse Oracle Analytics Cloud
기타 옵션 Oracle Data Integrator Oracle Exadata Database Service  
근거 Oracle Autonomous Data Warehouse에는 데이터 입수 및 세분화를 위해 사용이 간편하고 내장된 기능 세트가 포함되어 있습니다. 이러한 도구는 DB 작업 메뉴에서 찾을 수 있습니다. Oracle Autonomous Data Warehouse는 탄력적으로 확장되고 빠른 쿼리 성능을 제공하며 데이터베이스 관리가 필요 없는, 사용이 간편하고 완전히 자율적인 데이터베이스입니다. 또한 외부 테이블을 통해 오브젝트 스토리지에서 데이터에 직접 접근할 수 있습니다. Oracle Analytics Cloud는 선별된 데이터 계층(Oracle Autonomous Data Warehouse)과 완벽하게 관리되며 긴밀하게 통합됩니다.

배치

이 참조 아키텍처에 대한 Terraform 코드는 GitHub에서 제공됩니다. 한 번의 클릭으로 코드를 Oracle Cloud Infrastructure Resource Manager로 가져와서 스택을 생성하고 배포할 수 있습니다. 또는 GitHub에서 컴퓨터로 코드를 다운로드하고, 코드를 사용자 정의하고, Terraform CLI를 사용하여 구조를 배포할 수 있습니다.

  • Oracle Cloud Infrastructure Resource Manager를 사용하여 배치합니다.
    1. Oracle Cloud에 배치을 누릅니다.

      아직 사인인하지 않은 경우 테넌시 및 사용자 인증서를 입력합니다.

    2. 약관을 검토 및 수락합니다.
    3. 스택을 배치할 지역을 선택합니다.
    4. 화면 프롬프트 및 지침에 따라 스택을 만듭니다.
    5. 스택을 생성한 후 Terraform 작업을 누르고 계획을 선택합니다.
    6. 작업이 완료될 때까지 기다린 다음 계획을 검토합니다.

      변경하려면 [스택 세부정보] 페이지로 돌아가서 스택 편집을 누르고 필요한 변경을 수행합니다. 그런 다음 계획 작업을 다시 실행합니다.

    7. 추가 변경이 필요하지 않은 경우 스택 세부정보 페이지로 돌아가서 Terraform 작업을 누르고 적용을 선택합니다.
  • Terraform CLI를 사용하여 구축합니다.
    1. GitHub로 이동합니다.
    2. README 문서의 지침을 따릅니다.

로그 변경

이 로그에는 중요한 변경 사항만 나열됩니다.