关于使用 Oracle Modern Data Platform 进行业务报告和预测

此设计使用 Oracle Modern Data Platform 进行业务报告和预测。

考虑以下用例:企业具有大量来自内部和外部来源的产品销售数据。虽然历史和最近的销售数据对公司都有价值,但大多数情况下,在日常业务中使用的是最近几个月或几年的数据。此数据的使用者是使用此数据进行报告、分析和预测的业务用户。他们希望自己的报告和仪表盘能够快速返回结果,从而提高员工的工作效率。

传统上,企业依靠基于关系数据库的数据仓库来报告上述用例。但是,这些实现有几个限制 - 可扩展性和性能是这些限制中最突出的限制。

体系结构

更现代的方法是使用由 OCI 对象存储、Hadoop、Spark 等大数据技术以及用于报告的列式或传统数据库组成的数据湖仓一体架构。

Oracle Cloud Infrastructure (OCI) 提供多种工具和服务,可满足现代数据平台的所有需求。在此解决方案中,我们查看一小部分可满足架构要求的 OCI 服务。

  1. OCI 对象存储:一种 Internet 规模的高性能存储平台,可提供经济高效的数据持久性。它可以存储无限量的任何内容类型的非结构化数据,包括分析数据和丰富的内容,如图像和视频。
  2. Oracle Big Data Service :专为各种大数据用例和工作负载而设计的托管 Hadoop 服务。从用于处理特定任务的短生命周期集群到可以横向扩展以满足组织要求的长生命周期集群,成本低且安全性最高。
  3. Oracle Autonomous Database :易于使用、完全自治的数据库,可弹性扩展并提供快速查询性能。作为一种服务,Autonomous Database 不需要进行数据库管理。
  4. Oracle Analytics Cloud :可扩展且安全的公有云服务,可为业务分析师和消费者提供基于 AI 的现代自助分析功能,以支持数据准备、可视化、企业报告、增强分析和自然语言处理。

下图显示了体系结构。
下面是 oci-modern-data-reporting-arch.png 的说明
插图 oci-modern-data-reporting-arch.png 的说明

oci-modern-data-reporting-arch-oracle.zip

上面列出的每个体系结构组件都按以下方式协同工作:
  • OCI 对象存储层提供了可靠、经济高效的方式来存储大量数据。通过使用对象存储,您可以获得可供多个工具和服务使用的通用持久性数据存储。这还可以确保数据处理层可以独立于存储进行扩展或收缩。
  • Oracle Big Data Service 处理层提供了一个用于摄取、转换和聚合批量数据的平台。
  • 数据库层是一种快速高效的方法,用于为包含精选数据的客户端报告工具提供服务。最近和(或)仅相关数据保留在此层中。
  • Oracle Analytics Cloud 提供数据可视化和预测功能。

此体系结构支持以下组件:

  • OCI 数据集成

    Oracle Cloud Infrastructure Data Integration 是一项全托管、无服务器、云原生服务,可将各种数据源中的数据提取、加载、转换、清理和重塑为目标 Oracle Cloud Infrastructure 服务,例如 Autonomous Data WarehouseOracle Cloud Infrastructure Object Storage 。ETL(提取转换加载)利用 Spark 上的全托管横向扩展处理,ELT(提取加载转换)利用 Autonomous Data Warehouse 的完整 SQL 下推功能,尽可能减少数据移动,缩短新摄取的数据价值实现时间。用户使用直观、无代码的用户界面设计数据集成流程,该界面可优化集成流以生成高效的引擎和编排,并自动分配和扩展执行环境。Oracle Cloud Infrastructure Data Integration 提供交互式研究和数据准备功能,通过定义规则来处理模式更改,帮助数据工程师防范模式偏差。

  • Oracle Cloud Infrastructure 流处理提供了一个完全托管、可扩展且持久的存储解决方案,可以实时摄取连续的大量数据流,以供您使用和处理。您可以使用流处理来摄取大量数据,例如应用日志、运行状况遥测、Web 点击流数据;或者用于发布 - 订阅消息传递模式中连续生成和处理数据的其他使用场景。