關於使用 Oracle Modern Data Platform 進行業務報告和預測

此設計將探索如何使用 Oracle Modern Data Platform 進行業務報告和預測。

考慮企業從內部和外部來源取得大量產品銷售資料的使用案例。雖然歷史和最近的銷售資料都具有公司的價值,但大部分只會在日常業務中使用最近幾個月或幾年的資料。此資料的消費者是使用此資料進行報告、分析和預測的業務使用者。他們希望他們的報告和儀表板能快速傳回結果,以最大限度地提高員工生產力。

傳統上,企業仰賴以關聯式資料庫為基礎的資料倉儲來報告使用案例,例如上述案例。然而,這些實作有一些限制 - 擴展性和效能是這些限制最顯著的。

架構

更現代化的方法是使用由 OCI Object Storage 、大數據技術 (例如 Hadoop、Spark 及分欄式資料庫) 所組成的資料湖庫架構進行報告。

Oracle Cloud Infrastructure (OCI) 提供各式各樣的工具和服務,可滿足現代化資料平台的所有層面。在此解決方案中,我們研究了一小部分的 OCI 服務,以滿足架構需求。

  1. OCI 物件儲存:一種網際網路規模的高效能儲存平台,提供可靠且符合成本效益的資料持久性。它可以儲存任何內容類型的非結構化資料,包括分析資料和豐富的內容,例如影像和影片。
  2. Oracle Big Data Service :託管的 Hadoop 服務,專為各種大數據使用案例和工作負載所設計。從用來處理特定任務的短期叢集,到可以水平縱向擴展的長期叢集,以低成本和最高安全性水平滿足組織的需求。
  3. Oracle Autonomous Database :易於使用且完全自治的資料庫,可彈性調整規模並提供快速查詢效能。Autonomous Database 這項服務不需要資料庫管理。
  4. Oracle Analytics Cloud :一個可擴展的安全公有雲服務,為業務分析師和消費者提供現代化的 AI 支援自助式分析功能,用於資料準備、視覺化、企業報告、增強分析和自然語言處理。

下圖說明架構。
oci-modern-data-reporting-arch.png 的描述如下
oci-modern-data-reporting-arch.png 圖解描述

oci-modern-data-reporting-arch-oracle.zip

上述每個架構元件都以下列方式共同運作:
  • OCI Object Storage 層提供可靠且符合成本效益的方式來儲存大量資料。透過使用物件儲存,您將擁有一個可供多個工具和服務使用的通用保存資料存放區。這也確保資料處理層可以獨立於儲存中縱向擴展或縮減。
  • Oracle Big Data Service 處理層提供一個擷取、轉換及聚總大量資料的平台。
  • 資料庫層可做為快速高效的方法,為客戶提供精選資料的報告工具。此層會保存最近的資料,或只保存相關的資料。
  • Oracle Analytics Cloud 可將資料視覺化並進行預測。

此架構支援下列元件:

  • OCI 資料整合

    Oracle Cloud Infrastructure Data Integration 是一項完全受管理的無伺服器雲端原生服務,可從各種資料來源擷取、載入、轉換、清理及重新塑造資料至目標 Oracle Cloud Infrastructure 服務,例如 Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 。ETL (擷取轉換載入) 運用 Spark 上完全受管理的橫向擴展處理,而 ELT (擷取載入轉換) 運用 Autonomous Data Warehouse 的完整 SQL 下推功能,將資料移動降到最低,並縮短新擷取資料價值的時間。使用者使用直觀且無程式碼的使用者介面設計資料整合程序,將整合流程最佳化以產生最有效率的引擎和協調、自動配置及調整執行環境。Oracle Cloud Infrastructure Data Integration 提供互動式探索和資料準備,並定義處理綱要變更的規則,協助資料工程師防止綱要漂移。

  • 串流處理

    Oracle Cloud Infrastructure Streaming 提供完全管理、可擴展且持久的儲存解決方案,可讓您擷取連續的大量資料串流,並即時使用及處理。您可以使用「串流處理」來擷取大量資料 (例如應用程式日誌、作業遙測、Web 按一下串流資料);或用於在發布 / 訂閱訊息傳遞模型中以持續並循序產生及處理資料的其他使用案例。