了解如何从多个数据库创建数据集市用于连续分析

您的组织使用大量数据在各功能间推动业务决策,但是您的数据分布在多个系统和应用程序中的内部部署和内部部署。通过聚合和管理您的数据来收集业务洞察,这是一个手动化的资源密集型过程,会妨碍创新。

集中、可扩展和安全的数据仓库解决方案,包括轻松地迁移、数据管理和连续数据分析,可以帮助您获得要查找的业务洞察力。

用于从多个数据库为 Tableau Analytics 创建数据集市的体系结构

使用相对简单的架构模式,您可以将多个数据库源中的数据加载和优化到一个集中的数据仓库位置,以便您可以执行连续的数据分析来获得业务洞察力。

该体系结构包括以下一般组件:
  • Oracle Cloud Infrastructure:使用在 Oracle Cloud Infrastructure 中预配的服务转换和仓库了数据

  • Oracle GoldenGate:从一个或多个 Oracle 数据库转换数据,并将结果数据存储在 Oracle Autonomous Data Warehouse 中。数据仓库提供了安全、可扩展、动态数据仓库,以支持现代化分析和数据管理。

  • Tableau 桌面:您可以使用首选的分析引擎通过交互式可视化、加载和模拟数据以及通过创建报表和仪表盘来分析数据。

后面是 Architecture e-adw-tableau-analytics.png 的说明
插图 Architecture e-w-tableau-analytics.png 的说明

使用须知

要从一个或多个内部部署数据库中捕获数据,必须满足以下先决条件:

  • 您必须具有内部部署 Oracle Database 版本 Oracle 11g、Oracle 12c、Oracle 18c 或 Oracle 19c。

  • 准备要由 Oracle GoldenGate 访问的数据库。此解决方案提供必要的基本步骤。

  • 标识允许访问 Oracle Autonomous Data Warehouse 的一系列 IP 地址。

  • 必须在本地计算机上安装 Tableau Desktop。

数据安全

为了确保在系统之间移动数据时数据是安全的,该体系结构使用以下策略。

  • 从客户数据中心到 Oracle Cloud 的数据传输使用 VPN 或 Oracle Cloud Infrastructure FastConnect

  • SQL 访问使用用户名和口令以及 Oracle Wallet 身份证明进行验证。

  • Oracle Autonomous Data Warehouse 可以使用网络访问控制列表(ACL)控制访问。使用访问控制列表时,特定数据仓库仅接受来自访问控制列表中指定地址的连接并拒绝所有其他客户机连接。默认情况下,如果未指定网络访问控制列表,则可以从任何 IP 地址访问数据库。

数据库连接

有三种不同的方法可以连接到 Oracle Autonomous Data Warehouse

  1. 大多数组织使用防火墙保护网络和网络中的设备。防火墙使用规则控制传入和传出的网络通信,这些规则允许使用特定的端口和对特定计算机的访问(或者更具体的 IP 地址或主机名)。防火墙分离内部网络和公共互联网。

    可以使用公共互联网访问 Oracle Autonomous Data Warehouse。要从防火墙后访问 Oracle Autonomous Data Warehouse,该防火墙必须允许在连接中连接到服务器时使用数据库连接中指定的端口。Oracle Autonomous Data Warehouse 的默认端号为 1522。

  2. Oracle Cloud Infrastructure FastConnect 提供了一种使用 FastConnect 公共对等连接将内部部署网络连接到 Oracle Autonomous Data Warehouse 的简单方法。Oracle Cloud Infrastructure FastConnect 提供了带宽较高的选项,并且与基于互联网的连接相比具有更可靠且一致的网络体验。没有 Oracle Cloud Infrastructure FastConnect 时,会通过互联网路由为公共 IP 地址传送流量。

  3. Oracle Autonomous Data Warehouse 支持使用以下两种方法之一从虚拟云网络(VCN)中的 Oracle Cloud Infrastructure 资源进行私密访问:

    • 专用端点

    • 服务网关

    通过任一专用访问选项,这些流量都将保留在 Oracle Cloud Infrastructure 网络中,并且不会遍历 Internet。不过,如果使用服务网关,则对服务的请求使用公共端点进行服务。

    如果不希望使用公共端点,则可以使用 VCN 中的专用端点。专用端点表示为 VCN 中子网内的专用 IP 地址。专用端点仅适用于共享 Exadata 基础结构上的 Oracle Autonomous Data Warehouse

    通过服务网关和专用端点,可以从专用子网中的专用 IP 地址连接到 Oracle Autonomous Data Warehouse,而不需要您 VCN 中的互联网关。配置服务网关或专用端点后,没有连接到 Oracle Autonomous Data Warehouse 所需的特殊步骤。

关于为表提供的分析从多个数据库创建数据集市所需的服务

您应该熟悉预配和使用建议的服务和技术。在Oracle Cloud 环境中,为连续分析创建从一个或多个数据库集中的数据使用以下服务和功能:

数据是使用Oracle Cloud Marketplace 中的Oracle GoldenGate 从一个或多个内部部署 Oracle 数据库捕获的,并存储在Oracle Autonomous Data Warehouse中。Tableau 桌面提供了数据分析可视化。

要创建从一个或多个数据库进行连续分析的数据集,必须在Oracle Cloud Infrastructure上运行以下服务:

  • Oracle Cloud Marketplace 中的 Oracle GoldenGate 微服务

  • Oracle Autonomous Data Warehouse

请参阅了解如何获取适用于 Oracle 解决方案的 Oracle Cloud 服务以获取所需的云服务。

此外,您还将使用以下附加技术:
  • 使用 Tableau 桌面查看和分析数据。
  • 使用 SQL*Plus 命令行界面通过 Oracle Wallet 连接到Oracle Autonomous Data Warehouse
  • 使用 Oracle Instant Client 连接Oracle Cloud Infrastructure

    Oracle Instant Client 易于安装并仅使用Oracle Cloud Infrastructure 应用程序的完整客户端安装所需的五分之一磁盘空间。

    通过从下面的位置下载适合您的本地计算机的程序包来下载并安装 Oracle Instant Client。您可以在每个软件包的下载页面上找到安装说明。

    https://www.oracle.com/database/technologies/instant-client/downloads.html

关于角色和权限

要集成加载和分析数据所需的服务,需要具备特定的用户角色和权限。以后的部分中提供了用于创建角色和权限的步骤。

要使用Oracle Autonomous Data Warehouse的客户端访问身份证明下载 Wallet,您必须具有Oracle Autonomous Data Warehouse的管理员帐户。