数据平台 - 利用 E-Business 集成的数据仓库

分析师需要一种高效的方式,将来自多个财务系统、电子表格和其他数据源的数据整合到一个值得信赖、维护和查询优化的来源中。

通过 Oracle Autonomous Data Warehouse (ADW) 和 Oracle Analytics Cloud ,您可以将数据从 Oracle E-Business Suite 和其他来源加载并优化到集中数据仓库位置进行分析,以便部门可以获得具体可行的洞察。

此参考架构将技术解决方案定位到整体业务环境中:



业务部门通常无法及时或有效地访问数据和信息。分析师手动收集数据,逐个处理数据,然后通过电子邮件或文件服务器共享文件的副本。数据不集中,因此很难确保数据的准确性和安全性。分析可能需要很长时间,结果并不容易重复。

数据集市是一种简单的数据仓库形式,专注于单个主题或功能区,例如销售、营销或财务,通常由组织中的单个部门构建和控制。鉴于数据集市专注于单一主题,通常只能从几个来源提取数据。这些来源可能包括内部系统、中央数据仓库或外部数据。

受监管的数据仓库和数据集市可以向业务用户提供丰富的信息,并更有效地提供组织的关键绩效指标,而无需严重依赖 IT 资源和可用性。

体系结构

此体系结构使用 Oracle Autonomous Data Warehouse 中包含的数据转换功能,将多个源中的数据加载和优化到集中化的 Autonomous Data Warehouse 中,然后使用 Oracle Analytics Cloud 分析数据以提供具体可行的洞察。


后面是 data-platform-ebs.png 的说明
插图 data-platform-ebs.png 的说明

data-platform-ebs-oracle.zip

该体系结构侧重于以下逻辑划分:

  • 提取、转换

    摄取和调整数据以在体系结构中的每个数据层中使用。

  • 持续、策划、创建

    便于访问和导航数据以显示当前业务视图。对于关系技术,数据可以是逻辑的,也可以是以简单的关系、纵向、维或 OLAP 表单进行物理结构化。对于非关系数据,此层包含一个或多个数据池,这些数据来自分析流程的输出或针对特定分析任务优化的数据。

  • 分析、学习、预测

    为消费者抽象数据的逻辑业务视图。这种抽象有助于敏捷地处理发展、向目标体系结构迁移以及从多个联合来源提供单个报告层。

下图显示了使用安全最佳实践将上述架构映射到 Oracle Cloud Infrastructure 上提供的服务。



oci-adb-oac-arch-oracle.zip

该体系结构具有以下组件:

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse 是一种具有自我驱动、自我保护和自我修复功能的数据库服务,针对数据仓库负载进行了优化。您无需配置或管理任何硬件,也不需要安装任何软件。Oracle Cloud Infrastructure 用于处理数据库创建以及备份、打补丁、升级和优化数据库。

  • 数据集成

    Oracle 数据转换是一种 Oracle Data Integrator (ODI) 集成工具,可从 Autonomous Database 数据库操作(数据库工具)中部署。它提供了一个完全统一的解决方案,可用于在 SOA 或商务智能环境中构建、部署和管理复杂的数据仓库或以数据为中心的架构。此外,它还结合了数据集成、数据移动、数据同步、数据质量和数据管理的所有要素,以确保信息在复杂系统中及时、准确且一致。

  • 分析

    Oracle Analytics Cloud 是一项可扩展且安全的公有云服务,它为业务分析师提供基于 AI 的现代自助分析功能,可用于数据准备、可视化、企业报告、增强的分析以及自然语言处理和生成。通过 Oracle Analytics Cloud ,您还可以获得灵活的服务管理功能,包括快速设置、轻松扩展和打补丁以及自动生命周期管理。

该体系结构还包括以下组件:

  • 区域

    Oracle Cloud Infrastructure 区域是一个局部地理区域,其中包含一个或多个数据中心,称为可用性域。区域独立于其他区域,而广阔的距离可以分离它们(跨国家甚至大陆)。

  • 区间

    区间是 Oracle Cloud Infrastructure 租户中的跨区域逻辑分区。使用区间在 Oracle Cloud 中组织资源,控制对资源的访问,以及设置使用限额。要控制对给定区间中资源的访问,您需要定义策略来指定谁可以访问资源以及他们可以执行的操作。

  • 身份和访问管理 (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) 是 Oracle Cloud Infrastructure (OCI) 和 Oracle Cloud 应用的访问控制层。IAM API 和用户界面使您可以管理身份域和身份域中的资源。每个 OCI IAM 身份域代表一个独立的身份和访问管理解决方案或其他用户群体。

  • 策略

    Oracle Cloud Infrastructure Identity and Access Management 策略指定谁可以访问哪些资源以及如何访问哪些资源。在组和区间级别授予了访问权限,这意味着您可以编写策略向组授予特定区间或租户中特定类型的访问权限。

  • 可用性域

    可用性域是一个区域中的独立数据中心。每个可用性域中的物理资源都与其他可用性域中的资源隔离,因而具备容错能力。可用性域不共用电源、冷却设备或内部可用性域网络等基础设施。因此,一个可用性域出现故障不会影响区域中的其他可用性域。

  • 虚拟云网络 (VCN) 和子网

    VCN 是可在 Oracle Cloud Infrastructure 区域中设置的可定制的软件定义网络。与传统的数据中心网络一样,VCN 可以让您完全控制您的网络环境。VCN 可以具有多个不可重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 分段到子网,这些子网可以限定到区域或可用性域。每个子网包含一个连续的地址范围,这些地址与 VCN 中的其他子网不重叠。您可以在创建子网后更改其大小。子网可以是公共子网,也可以是专用子网。

  • Internet 网关

    互联网网关允许 VCN 中的公共子网与公共互联网之间的通信。

  • 站点到站点 VPN

    站点到站点 VPN 提供了内部部署网络与 Oracle Cloud Infrastructure 中的 VCN 之间的 IPSec VPN 连接。IPSec 协议套件会在将数据包从源传输到目标之前加密 IP 通信,并在数据包到达时解密通信。

  • 动态路由网关 (DRG)

    DRG 是一个虚拟路由器,它提供同一区域、同一 VCN 与区域之外的网络(例如另一个 Oracle Cloud Infrastructure 区域中的 VCN、内部部署网络或其他云提供商中的网络)之间的专用网络通信路径。

  • 网络地址转换 (Network address translation,NAT) 网关

    NAT 网关允许 VCN 中的专用资源访问互联网上的主机,同时不会向传入的互联网连接公开这些资源。

  • 服务网关

    通过服务网关,可以从 VCN 访问其他服务,例如 Oracle Cloud Infrastructure Object Storage 。从 VCN 到 Oracle 服务的流量通过 Oracle 网络结构传输,永远不会经过互联网。

  • 路由表

    虚拟路由表包含将流量从子网路由到 VCN 之外的目的地(通常通过网关)的规则。

  • 安全列表

    对于每个子网,您可以创建安全规则来指定必须允许传入和传出子网的通信的源、目标和类型。

  • 网络安全组 (NSG)

    网络安全组 (NSG) 充当云资源的虚拟防火墙。使用 Oracle Cloud Infrastructure 的零信任安全模型,将拒绝所有流量,您可以控制 VCN 中的网络流量。NSG 包含一组入站和出站安全规则,这些规则仅应用于单个 VCN 中的一组指定 VNIC。

  • 堡垒主机

    堡垒主机是计算实例,用作从云外部访问拓扑的安全受控入口点。堡垒主机通常在非军事区 (DMZ) 中进行预配。它使您可以通过将敏感资源放置在无法直接从云外部访问的专用网络中来保护敏感资源。拓扑有一个已知入口点,您可以定期监视和审计。因此,您可以避免公开拓扑中更敏感的组件,而不会影响对它们的访问。

  • 对象存储

    通过对象存储,可以快速访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及丰富的内容(例如图像和视频)。您可以安全可靠地存储数据,然后直接从互联网或云平台检索数据。您可以在不降低性能或服务可靠性的情况下无缝扩展存储。将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长时间保留的“冷”存储,很少或很少访问。

建议

使用以下建议作为起点,将数据从 Oracle E-Business Suite 和其他来源加载和优化到集中式数据仓库位置进行分析。

您的要求可能不同于此处介绍的体系结构。

  • 数据精炼厂

    通过 Oracle Autonomous Data Warehouse 内置服务“数据转换”,您可以创建数据源与目标之间的映射,以使用 ETL 和 E-LT 方法细化和清理数据。

  • 通过数据集成支持 EBS

    Oracle E-Business Suite 中的知识模块可帮助您从业务应用程序中提取数据,并通过 Oracle Database 的定期映射将其集成到数据仓库中。

  • Oracle Analytics Cloud

    在将 Oracle Analytics Cloud 连接到 Oracle Autonomous Data Warehouse 之前,请让数据库管理员将 Oracle Analytics Cloud 实例的 IP 地址(或地址范围)添加到批准的地址列表中。数据库管理员必须添加允许从 Oracle Analytics Cloud 到数据库的 TCP/IP 流量的安全规则。

考虑事项

在将数据从 Oracle E-Business Suite 和其他来源加载和优化到集中数据仓库位置进行分析时,请考虑以下实施选项。

指南 数据精炼厂 数据持久性平台 访问和解释
推荐 Oracle Autonomous Data Warehouse 工具 Oracle Autonomous Data Warehouse Oracle Analytics Cloud
其他选项 Oracle Data Integrator Oracle Exadata Database Service  
原理 Oracle Autonomous Data Warehouse 包含一组易于使用的内置功能,用于提取和细化数据。可以在“DB Actions(数据库操作)”菜单中找到这些工具。 Oracle Autonomous Data Warehouse 是一个易于使用、完全自治的数据库,可以弹性扩展、提供快速查询性能且不需要数据库管理。此外,它还通过外部表直接访问对象存储中的数据。 Oracle Analytics Cloud 是一个完全托管且与精细的数据层 (Oracle Autonomous Data Warehouse) 紧密集成的云。

部署

GitHub 中提供了此引用体系结构的 Terraform 代码。只需单击一下即可将代码拉入 Oracle Cloud Infrastructure Resource Manager,创建堆栈并部署它。或者,您也可以使用 Terraform CLI 将代码从 GitHub 下载到您的计算机,定制代码并部署架构。

  • 使用 Oracle Cloud Infrastructure Resource Manager 部署:
    1. 单击 部署到 Oracle Cloud

      如果您尚未登录,请输入租户和用户凭证。

    2. 查看并接受条款和条件。
    3. 选择要将堆栈部署到的区域。
    4. 按照屏幕上的提示和说明创建堆栈。
    5. 创建堆栈后,单击 Terraform Actions,然后选择 Plan(计划)
    6. 等待作业完成,然后查看计划。

      要进行任何更改,请返回 "Stack Details"(堆栈详细信息)页面,单击 Edit Stack(编辑堆栈),然后进行所需的更改。然后,再次运行计划操作。

    7. 如果不需要进一步更改,请返回 "Stack Details"(堆栈详细信息)页面,单击 Terraform Actions(Terraform 操作),然后选择 Apply(应用)
  • 使用 Terraform CLI 部署:
    1. 转到 GitHub
    2. 按照 README 文档中的说明进行操作。

更改日志

此日志仅列出重要的更改: