Oracle 최신 데이터 플랫폼으로 멀티클라우드 데이터 분석 수행

조직은 엔터프라이즈 데이터 웨어하우스를 구축하여 라이브 및 아카이브된 데이터를 한 곳에 저장할 수 있습니다.

비즈니스 프로세스 완료, 수행 중인 운영 또는 판매 중인 제품의 결과로 데이터가 생성됩니다. 이기종 데이터 소스로 인해 조직은 모든 데이터 분석 요구를 충족하는 원스톱 숍인 중앙 집중식 데이터 저장소를 구축하는 간소화된 접근 방식을 채택하고자 합니다. 사용자, 제조업체, 유통업체, 파트너, 타사 공급업체가 보고한 데이터와 같은 다양한 소스와 일상적인 소매 주문 및 고객 피드백으로 인해 목표는 비즈니스 기능별로 추출 및 분석된 중앙 집중식 엔터프라이즈 데이터 웨어하우스 리포지토리를 만들어 엔드 투 엔드 비즈니스 가시성을 구축하고 데이터 기반 정보에 대응하는 것입니다.

조직은 정보를 활용하고 데이터 기반 의사 결정을 내려 비즈니스를 보다 효율적으로 운영하고자 합니다. 이 멀티클라우드 데이터 분석 솔루션을 통해 조직은 Oracle Fusion Cloud Enterprise Resource Planning, 온프레미스 Microsoft Azure SQL Server(SQL Server), Salesforce, eBayGoogle Analytics와 같은 여러 데이터 소스에 통합하여 Oracle 최신 데이터 플랫폼에서 중앙 데이터 웨어하우스를 사용하여 분석을 효과적으로 실행할 수 있습니다.

다음의 혜택이 제공됩니다.

  • 통합 데이터 분석 파이프라인

    데이터베이스 및 객체 저장소에 저장된 데이터를 포함하여 클라우드 및 온프레미스 설치 전반의 모든 데이터에 대한 액세스를 간소화합니다.

  • 통합 용이성

    데이터 통합, 통합, 동기화, 매시업 등 다양한 시스템의 데이터를 통합합니다. 모든 데이터, 형식, API를 모든 속도, 모든 애플리케이션 또는 모든 디바이스와 통합할 수 있습니다. 이 모든 것은 안전한 협업, 보안 규칙 준수, 코드 작성 없이 가능합니다.

  • 고성능 분석

    쿼리 도구를 사용하여 데이터에 빠르게 액세스하면 신속한 의사 결정을 내리고 고객 서비스를 개선할 수 있습니다.

  • 고급 분석 기능

    데이터 및 텍스트 마이닝, 머신 러닝, 예측, 정서 분석, 네트워크 및 클러스터 분석, 그래프 분석, 복잡한 이벤트 처리 및 신경망과 같은 고급 분석 기술을 지원합니다.

  • 단일 플랫폼

    팀 내 협업을 강화하고 실행 및 시장 출시 시간을 개선하며 혁신을 가속화하는 단일 클라우드 기반 플랫폼입니다.

  • 비용, 보안 및 가용성

    조직은 자본 지출(CapEx) 및 운영 지출(OpEx) 비용을 줄이려고 하지만 비용과 성능, 보안 및 가용성을 적절히 결합하고자 합니다.

구조

이 참조 아키텍처는 다양한 소스의 데이터를 가져와서 포맷하고 Oracle Cloud Infrastructure(OCI)의 엔터프라이즈 데이터 웨어하우스로 이동한 다음 Oracle Analytics Cloud(OAC)를 사용하여 분석하는 엔터프라이즈 멀티클라우드 데이터 분석 파이프라인을 보여줍니다.

이 데이터는 Oracle Integration 및 OCI 통합 서비스를 사용하여 다양한 소스에서 통합됩니다. 표시된 데이터 소스는 Salesforce, eBay, SQL Server, Oracle Fusion Cloud ServiceGoogle Analytics이지만, 이 솔루션은 API 호출 또는 데이터베이스 연결을 허용하는 모든 데이터 소스에 적용됩니다. OCI 통합 서비스는 모든 애플리케이션 및 데이터 소스를 연결하여 엔드 투 엔드 프로세스를 자동화하고 관리를 중앙 집중화합니다. 사전 구축된 어댑터와 로우 코드 커스터마이징 기능을 갖춘 광범위한 통합으로 클라우드로의 마이그레이션을 간소화하는 동시에 멀티클라우드 운영을 간소화합니다.

Oracle Integration(OIC)은 SalesforceeBay, Oracle Fusion Cloud Service를 비롯한 모든 애플리케이션, 데이터 및 서비스와 B2B(Business-to-Business) 통신을 위한 파트너 에코시스템을 연결합니다.B2B 데이터는 Oracle Integration 서비스를 사용하여 가변 소스에서 통합됩니다. 스테이징 계층의 다양한 모든 소스에서 데이터를 사용할 수 있게 되면 Data Integration을 사용하여 데이터가 정리, 표준화, 병합 및 변환됩니다. ADW는 스테이징 레이어, 참조 데이터 및 분석 레이어를 저장합니다. OAC는 대시보드, 보고서, KPI를 생성하고 조직 전반의 셀프 서비스 분석을 수행하기 위한 분석 도구로 사용되고 있습니다. OAC의 사전 구축된 커넥터를 사용하여 Google Analytics에서 데이터를 복제하고 병합할 수 있습니다.



oci-multicloud-data-analytics-다이어그램-oracle.zip

데이터 소스 통합:

  • Google Analytics 통합

    사용자는 OAC 내장 Google Analytics 데이터 커넥터를 사용하여 Google Drive 또는 Google Analytics에 대한 접속을 생성합니다. 연결에서 클라이언트 암호 및 Google Analytics 뷰 이름과 함께 Google 공인 리디렉션 URI를 사용해야 합니다. 권한이 부여되면 OAC에서 변환을 읽고 대시보드를 생성할 준비가 된 것입니다.

  • Salesforce 통합

    Salesforce 어댑터를 통해 사용자는 Salesforce.com를 사용하여 단순화된 양방향 통합을 생성할 수 있습니다. 비즈니스 객체 및 작업을 검색할 수 있으며 Salesforce.com 비즈니스 객체와 손쉽게 매핑할 수 있습니다. OIC는 Salesforce 어댑터와 연결을 생성하는 워크플로우를 작성한 다음 데이터를 ADW로 가져옵니다.

  • Microsoft Azure SQL Server 통합

    ADW와 SQL Server 데이터 통합은 Data Integration을 사용하여 수행됩니다. SQL Server에서 ADW로 데이터 파이프라인을 생성하고 소스 데이터 자산을 지정한 다음 대상 데이터 자산으로 로드될 때 데이터를 정리하고 처리하도록 변환을 구성합니다. 특정 프로세스 집합을 순서대로 실행하려면 파이프라인을 생성합니다. 파이프라인 설계는 연산자를 사용하여 원하는 작업과 작업을 추가하는 데이터 플로우 작성과 유사합니다. 파이프라인을 구축한 후 파이프라인을 사용하는 파이프라인 작업을 생성합니다. 태스크를 생성한 후 기본 애플리케이션 또는 사용자 고유 애플리케이션에 게시합니다. 응용 프로그램이 작업을 실행한 다음 작업 진행 및 상태를 모니터합니다. 자동 실행에 대한 작업을 예약할 수도 있습니다.

  • 수동 데이터 피드(플랫 파일)

    Oracle Cloud Infrastructure Object Storage는 비즈니스 파일 저장소로 사용되며, 비즈니스 및 운영 사용자는 대상, 예측, 월별 고객 마커, 임시 인력 조정 측정지표 등의 수동 데이터 피드 파일을 업로드했습니다. Oracle Cloud Infrastructure Object Storage 버킷에서 데이터 파일을 사용할 수 있게 되면 Data Integration을 사용하여 자동으로 처리를 선택합니다.

  • Oracle Fusion Service 통합

    OCI Data Integration은 Oracle Business Intelligence Cloud Connector(BICC)를 사용하여 Fusion Applications에 데이터 소스로 연결할 수 있도록 합니다. Fusion Applications 데이터 자산을 소스로 사용하여 ERP 또는 HCM 클라우드와 같은 Fusion Applications에서 데이터를 추출합니다. OCI Data Integration은 추출된 데이터를 BICC에 구성된 사전 정의된 외부 스토리지 위치로 로드합니다. Parquet 형식의 Fusion Applications에서 Oracle Cloud Infrastructure Object Storage로 데이터를 로드한 다음 ADW의 스테이징 계층으로 데이터를 로드합니다.

아키텍처에는 다음과 같은 구성 요소가 있습니다.

  • 테넌시

    테넌시는 Oracle Cloud Infrastructure에 등록할 때 Oracle이 Oracle Cloud 내에서 설정하는 격리된 보안 파티션입니다. 테넌시 내 Oracle Cloud에서 리소스를 생성, 구성 및 관리할 수 있습니다. 테넌시는 회사 또는 조직과 동의어입니다. 일반적으로 회사는 단일 테넌시를 갖고 해당 테넌시 내의 조직 구조를 반영합니다. 일반적으로 단일 테넌시는 단일 구독에 연결되며, 단일 구독에는 일반적으로 하나의 테넌시만 있습니다.

  • 지역

    Oracle Cloud Infrastructure 리전은 가용성 도메인이라는 하나 이상의 데이터 센터를 포함하는 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며 방대한 거리로 구분할 수 있습니다(국가 또는 대륙).

  • 구획

    구획은 Oracle Cloud Infrastructure 테넌시 내의 영역 간 논리적 파티션입니다. 구획을 사용하여 Oracle Cloud에서 리소스를 구성하고, 리소스에 대한 액세스를 제어하고, 사용 할당량을 설정할 수 있습니다. 지정된 구획의 리소스에 대한 액세스를 제어하기 위해 리소스에 액세스할 수 있는 사용자 및 수행할 수 있는 작업을 지정하는 정책을 정의합니다.

  • Autonomous Database

    Oracle Autonomous Database는 트랜잭션 처리 및 데이터 웨어하우징 워크로드에 사용할 수 있는 완전 관리형의 사전 구성된 데이터베이스 환경입니다. 하드웨어를 구성 또는 관리하거나 소프트웨어를 설치하지 않아도 됩니다. Oracle Cloud Infrastructure는 데이터베이스 생성과 데이터베이스 백업, 패치, 업그레이드 및 튜닝을 처리합니다.

  • 분석

    Oracle Analytics Cloud는 데이터 준비, 시각화, 엔터프라이즈 보고, 증강 분석, 자연어 처리 및 생성을 위한 최신 AI 기반 셀프 서비스 분석 기능을 통해 비즈니스 분석가를 지원하는 확장 가능하고 안전한 퍼블릭 클라우드 서비스입니다. 또한 Oracle Analytics Cloud를 통해 빠른 설정, 손쉬운 확장 및 패치 적용, 자동화된 라이프사이클 관리 등 유연한 서비스 관리 기능을 활용할 수 있습니다.

  • 객체 스토리지

    객체 스토리지를 사용하면 데이터베이스 백업, 분석 데이터, 이미지 및 비디오와 같은 리치 콘텐츠 등 모든 콘텐츠 유형의 대량의 구조적 및 비구조적 데이터에 빠르게 액세스할 수 있습니다. 인터넷 또는 클라우드 플랫폼 내에서 직접 안전하고 안전하게 데이터를 저장하고 검색할 수 있습니다. 성능 또는 서비스 안정성의 저하 없이 스토리지를 원활하게 확장할 수 있습니다. 빠르고 즉각적이며 자주 액세스하는 데 필요한 "핫" 스토리지에 표준 스토리지를 사용합니다. 장기간 보존하고 거의 액세스하지 않는 "콜드" 스토리지에 아카이브 스토리지를 사용합니다.

  • 가용성 도메인

    가용성 도메인은 한 지역 내의 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 다른 가용성 도메인의 리소스와 격리되어 내결함성을 제공합니다. 가용성 도메인은 전원, 냉각 또는 내부 가용성 도메인 네트워크와 같은 인프라를 공유하지 않습니다. 따라서 특정 가용성 도메인에서 실패할 경우 해당 지역의 다른 가용성 도메인에 영향을 주지 않습니다.

  • VCN(가상 클라우드 네트워크) 및 서브넷

    VCN은 Oracle Cloud Infrastructure 지역에서 설정한 커스터마이징 가능한 소프트웨어 정의 네트워크입니다. 기존 데이터 센터 네트워크와 마찬가지로 VCN은 사용자가 네트워크 환경을 완전히 제어할 수 있도록 합니다. VCN에는 VCN을 생성한 후 변경할 수 있는 겹치지 않는 여러 CIDR 블록이 있을 수 있습니다. VCN을 서브넷으로 분할할 수 있습니다. 서브넷은 지역 또는 가용성 도메인으로 범위가 지정될 수 있습니다. 각 서브넷은 VCN의 다른 서브넷과 겹치지 않는 연속된 주소 범위로 구성됩니다. 서브넷 생성 후 서브넷의 크기를 변경할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.

  • OCI 통합 서비스

    OCI 통합 서비스는 모든 애플리케이션 및 데이터 소스를 연결하여 엔드 투 엔드 프로세스를 자동화하고 관리를 중앙 집중화합니다. 사전 구축된 어댑터와 로우 코드 커스터마이징 기능을 갖춘 광범위한 통합으로 클라우드로의 마이그레이션을 간소화하는 동시에 멀티클라우드 운영을 간소화합니다.

  • OCI 애플리케이션 통합

    OCI 애플리케이션 통합은 SaaS 및 온프레미스 애플리케이션에 대한 사전 구축 연결, 실행 준비된 프로세스 자동화 템플리트, 웹 및 모바일 애플리케이션 개발을 위한 로우코드 시각적 빌더를 제공합니다. Oracle Cloud ERP, HCM 및 CX의 이벤트에 기본 액세스할 수 있습니다. 앱별 분석 사일로를 연결하여 구매요청-입고, 채용-지불, 가망고객-송장 및 기타 중요한 프로세스를 간소화함으로써 IT 및 비즈니스 리더에게 포괄적인 가시성을 제공합니다.

  • 데이터 통합

    Oracle Cloud Infrastructure Data Integration은 다양한 데이터 소스에서 데이터를 추출, 로드, 변환, 정리 및 재구성하는 완전 관리형 서버리스 클라우드 네이티브 서비스로, Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage와 같은 대상 Oracle Cloud Infrastructure 서비스로 변환합니다. ETL(변환 로드 추출)은 Spark에서 완전 관리형 스케일 아웃 처리를 활용하며 ELT(로드 변환 추출)는 Autonomous Data Warehouse의 전체 SQL 푸시 다운 기능을 활용하여 데이터 이동을 최소화하고 새로 수집된 데이터의 가치 실현 시간을 단축합니다. 사용자는 통합 플로우를 최적화하여 가장 효율적인 엔진 및 통합관리를 생성하고 실행 환경을 자동으로 할당 및 확장하는 직관적인 코드 없는 사용자 인터페이스를 사용하여 데이터 통합 프로세스를 설계합니다. Oracle Cloud Infrastructure Data Integration은 대화식 탐색 및 데이터 준비를 제공하며 데이터 엔지니어가 스키마 변경을 처리하는 규칙을 정의하여 스키마 드리프트로부터 보호할 수 있도록 지원합니다.

수락

Authors: Parag Pardhi

Contributors: Wei Han, Daryl Eicher, John Sulyok