비즈니스 보고 및 예측을 위한 Oracle Modern Data Platform 사용 정보

이 설계에서는 비즈니스 보고 및 예측을 위해 Oracle Modern Data Platform을 사용하는 방법을 살펴봅니다.

기업이 내부 및 외부 소스의 대량의 제품 판매 데이터를 보유한 사용 사례를 고려해 보십시오. 과거 및 최근 판매 데이터 모두 회사의 가치가 있지만 최근 몇 개월 또는 수년간의 데이터만 일상적인 비즈니스에 사용됩니다. 이 데이터의 소비자는 이 데이터를 보고, 분석 및 예측에 사용하는 비즈니스 사용자입니다. 직원 생산성을 극대화하기 위해 보고서와 대시보드가 신속하게 결과를 반환하기를 원합니다.

전통적으로 기업들은 위에서 언급한 사용 사례를 보고하기 위해 관계형 데이터베이스를 기반으로 데이터 웨어하우스에 의존했습니다. 그러나 이러한 구현에는 몇 가지 제한 사항이 있었습니다. 확장성과 성능이 이러한 제한 사항 중에서 가장 두드러집니다.

구조

보다 현대적인 접근 방식은 OCI Object Storage, Hadoop, Spark, 컬럼 또는 기존 데이터베이스와 같은 빅데이터 기술로 구성된 데이터 레이크하우스 아키텍처를 보고하는 것입니다.

Oracle Cloud Infrastructure(OCI)에는 모던 데이터 플랫폼의 모든 측면을 다루는 다양한 도구와 서비스가 있습니다. 이 솔루션에서는 아키텍처 요구 사항을 해결하는 OCI 서비스의 작은 하위 세트를 살펴봅니다.

  1. OCI Object Storage: 안정적이고 비용 효율적인 데이터 내구성을 제공하는 인터넷 규모의 고성능 스토리지 플랫폼입니다. 분석 데이터와 이미지 및 비디오와 같은 리치 콘텐츠를 포함한 모든 콘텐츠 유형의 구조화되지 않은 데이터를 무제한으로 저장할 수 있습니다.
  2. Oracle Big Data Service: 다양한 빅데이터 사용 사례 및 워크로드를 위해 설계된 관리형 Hadoop 서비스입니다. 특정 작업을 처리하는 데 사용되는 수명이 짧은 클러스터부터 수명이 긴 클러스터까지, 낮은 비용으로 최고 수준의 보안으로 조직의 요구사항을 충족하도록 수평 확장할 수 있습니다.
  3. Oracle Autonomous Database: 탄력적으로 확장되고 빠른 쿼리 성능을 제공하는 사용하기 쉽고 완전히 자율적인 데이터베이스입니다. 서비스로서 Autonomous Database에는 데이터베이스 관리가 필요하지 않습니다.
  4. Oracle Analytics Cloud: 확장 가능하고 안전한 퍼블릭 클라우드 서비스로, 데이터 준비, 시각화, 엔터프라이즈 보고, 증강 분석 및 자연어 처리를 위한 최신 AI 기반 셀프 서비스 분석 기능을 비즈니스 분석가와 소비자에게 제공합니다.

다음 이미지는 구조를 보여줍니다.
다음은 oci-modern-data-reporting-arch.png에 대한 설명입니다.
oci-modern-data-reporting-arch.png 그림에 대한 설명

oci-modern-data-reporting-arch-oracle.zip

위에 나열된 각 구조 구성 요소는 다음과 같은 방식으로 함께 작동합니다.
  • OCI Object Storage 계층은 방대한 양의 데이터를 저장할 수 있는 안정적이고 비용 효율적인 방법을 제공합니다. Object Storage를 사용하면 여러 도구 및 서비스에서 사용할 수 있는 공통 지속성 데이터 저장소를 사용할 수 있습니다. 또한 스토리지와 독립적으로 데이터 처리 계층을 확장하거나 축소할 수 있습니다.
  • Oracle Big Data Service 처리 계층은 대량의 데이터를 수집, 변환 및 집계하는 플랫폼을 제공합니다.
  • 데이터베이스 계층은 선별된 데이터를 사용하여 클라이언트 보고 도구를 제공하는 빠르고 효율적인 방법입니다. 최근 또는 관련 데이터만 이 계층에 유지됩니다.
  • Oracle Analytics Cloud는 데이터를 시각화하고 예측할 수 있는 기능을 제공합니다.

이 구조는 다음 구성 요소를 지원합니다.

  • OCI 데이터 통합

    Oracle Cloud Infrastructure Data Integration은 다양한 데이터 소스의 데이터를 추출, 로드, 변환, 정리 및 대상 Oracle Cloud Infrastructure 서비스(예: Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage)로 재구성하는 완전 관리형 서버리스 클라우드 전용 서비스입니다. ETL(변환 로드 추출)은 Spark에서 완전 관리형 스케일 아웃 처리를 활용하며 ELT(로드 변환 추출)는 데이터 이동을 최소화하고 새로 수집된 데이터의 가치 실현 시간을 개선하기 위해 Autonomous Data Warehouse의 전체 SQL 푸시 다운 기능을 활용합니다. 사용자는 통합 플로우를 최적화하여 가장 효율적인 엔진 및 통합관리를 생성하고 실행 환경을 자동으로 할당 및 확장하는 직관적인 코드 없는 사용자 인터페이스를 사용하여 데이터 통합 프로세스를 설계합니다. Oracle Cloud Infrastructure Data Integration은 대화식 탐색 및 데이터 준비를 제공하며 데이터 엔지니어가 스키마 변경을 처리하는 규칙을 정의하여 스키마 드리프트로부터 보호할 수 있도록 지원합니다.

  • 스트리밍

    Oracle Cloud Infrastructure Streaming은 실시간으로 소비하고 처리할 수 있는 지속적인 고용량 데이터 스트림을 수집할 수 있는 확장 가능하며 내구성 있는 전담 관리 스토리지 솔루션을 제공합니다. Streaming을 사용하여 애플리케이션 로그, 운영 원격 측정, 웹 클릭-스트림 데이터와 같은 대용량 데이터를 입수하거나 게시-구독 메시징 모델에서 데이터가 연속적으로 생성되고 처리되는 기타 사용 사례에 사용할 수 있습니다.