使用 OCI Full Stack Disaster Recovery 拓扑设计 Oracle Hyperion EPM System

Oracle Cloud Infrastructure Full Stack Disaster Recovery Service 助您一键完成全球 Oracle Cloud Infrastructure (OCI) 区域之间的计算、数据库和应用转换。您可以自动执行恢复一个或多个业务系统所需的步骤,而无需重新设计或重新设计现有基础设施、数据库或应用程序。灾难恢复 (Disaster Recovery,DR) 策略对应用程序的引导卷和块存储卷以及从生产环境到备用站点的数据库使用 Oracle Data Guard 的全面复制,从而大大简化了备用位置的配置。此方法符合 Oracle Enterprise Performance Management System Deployment Options Guide 中概述的 DR 准则,该指南遵循为 Oracle 提供的灾难恢复建议。Oracle Fusion Cloud Enterprise Performance Management (Oracle Cloud Enterprise Performance Management ) 和 Oracle Hyperion Enterprise Performance Management System (EPM) 可在此架构中互换使用。

体系结构

此架构显示了跨两个 OCI 区域(主区域和备用区域)的 Oracle Enterprise Performance Management (EPM) 系统的全栈灾难恢复 (DR) 架构。每个区域都包含虚拟云网络 (Virtual Cloud Network,VCN)、负载平衡器、虚拟机、引导卷、块存储卷、文件存储和数据库。

下图说明了此引用体系结构。

下面是 epm-fsdr-architecture.png 的说明
插图 epm-fsdr-architecture.png 的说明

epm-fsdr-architecture-oracle.zip

主要功能包括:

  • 跨区域复制:跨区域复制引导卷、块存储卷和文件存储,确保数据同步。
  • Data Guard:数据库使用 Oracle Data Guard 进行连续数据复制,从而确保备用区域具有主数据库的最新副本。
  • 远程对等连接:两个区域中的 DRG(Dynamic Routing Gateways,动态路由网关)通过远程对等连接进行连接,从而实现区域之间的网络流量和资源连接。此设置支持强大的灾难恢复解决方案,可确保 Oracle EPM 系统实现高可用性和业务连续性。

该体系结构具有以下组件:

  • 区域

    Oracle Cloud Infrastructure 区域是包含一个或多个数据中心(称为可用性域)的本地化地理区域。地区独立于其他地区,远距离可以把它们分开(跨越国家甚至大陆)。

  • Tenancy

    租户是 Oracle 在您注册 Oracle Cloud Infrastructure 时在 Oracle Cloud 中设置的安全隔离分区。您可以在您的租户内的 Oracle Cloud 中创建、组织和管理资源。租户是公司或组织的同义词。通常,公司将具有单个租户并反映其在该租户中的组织结构。单个租户通常与单个订阅关联,单个订阅通常只有一个租户。

  • 虚拟云网络 (VCN) 和子网

    VCN 是一个可定制的软件定义网络,您可以在 Oracle Cloud Infrastructure 区域中设置。与传统的数据中心网络一样,VCN 允许您控制您的网络环境。VCN 可以具有多个不重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 划分为子网,子网可以限定为区域或可用性域。每个子网都包含一系列不与 VCN 中的其他子网重叠的连续地址。可以在创建后更改子网的大小。子网可以是公共子网,也可以是专用子网。

  • 远程对等连接

    通过远程对等连接,VCN 的资源可以使用专用 IP 地址进行通信,而无需通过互联网或内部部署网络路由流量。对于需要与不同区域中的其他 VCN 通信的实例,使用远程对等连接无需互联网网关和公共 IP 地址。

  • 动态路由网关 (DRG)

    DRG 是虚拟路由器,用于为同一区域中的 VCN 之间、VCN 与区域外的网络(例如另一个 Oracle Cloud Infrastructure 区域中的 VCN、内部部署网络或另一个云提供商中的网络)之间的专用网络流量提供路径。

  • 负载平衡器

    Oracle Cloud Infrastructure Load Balancing 服务提供从单个入口点到后端多个服务器的自动流量分配。

  • 应用程序服务器

    应用服务器使用辅助对等方(如数据库)在发生灾难时将接管处理。应用服务器使用同时存储在数据库和文件系统的配置和元数据。应用服务器集群在单个区域范围内提供保护,但持续的修改和新部署需要持续复制到辅助位置,以实现一致的灾难恢复。

  • 块存储卷

    借助 Oracle Cloud Infrastructure Block Volumes ,您可以创建、附加、连接和移动存储卷,以及更改卷性能,从而满足您的存储、性能和应用要求。将卷附加到实例并将卷连接到实例后,您可以像常规硬盘驱动器那样使用该卷。还可以断开卷连接并将其连接到其他实例,而不会丢失数据。

  • 文件存储

    Oracle Cloud Infrastructure File Storage 服务提供持久、可扩展、安全的企业级网络文件系统。您可以从 VCN 中的任何裸金属、虚拟机或容器实例连接到文件存储服务文件系统。您还可以使用 Oracle Cloud Infrastructure FastConnect 和 IPSec VPN 从 VCN 外部访问文件系统。

  • 对象存储

    Oracle Cloud Infrastructure Object Storage 支持您快速访问任意内容类型的大量结构化和非结构化数据,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地存储数据,然后直接从互联网或云平台检索数据。您可以在不降低性能或服务可靠性的情况下扩展存储。将标准存储用于需要快速、立即和频繁访问的“热”存储。将归档存储用于长期保留、很少访问或很少访问的“冷”存储。

  • 计算服务

    借助 Oracle Cloud Infrastructure Compute ,您可以在云中预配和管理计算主机。您可以通过配置启动计算实例,以满足对 CPU、内存、网络带宽和存储的资源要求。创建计算实例后,可以安全地访问该实例,重新启动该实例,附加和分离卷,并在不再需要时终止该实例。

  • Data Guard

    Oracle Data Guard 和 Oracle Active Data Guard 提供一组全面的服务,用于创建、维护、管理和监视一个或多个备用数据库,并使生产 Oracle 数据库在不中断的情况下保持可用。Oracle Data Guard 使用内存中复制将这些备用数据库作为生产数据库的副本进行维护。如果生产数据库由于计划内或计划外停机而变得不可用,则 Oracle Data Guard 可以将任何备用数据库切换到生产角色,从而最大限度地减少与停机关联的停机时间。Oracle Active Data Guard 提供了将以读为主的负载卸载到备用数据库的额外功能,并且还提供了高级数据保护功能。

  • DNS

    Oracle Cloud Infrastructure 域名系统 (Domain Name System,DNS) 服务是一个高度可扩展的全局任播域名系统 (DNS) 网络,可提供增强的 DNS 性能、可恢复性和可扩展性,以便最终用户随时随地尽快连接到客户应用。

  • Oracle Base Database Service

    Oracle Base Database Service 是一项 Oracle Cloud Infrastructure (OCI) 数据库服务,支持您在虚拟机上构建、扩展和管理功能齐全的 Oracle 数据库。Oracle Base Database Service 使用 OCI Block Volumes 存储而非本地存储,并且可以运行 Oracle Real Application Clusters (Oracle RAC) 来提高可用性。

  • 完整堆栈灾难恢复服务

    Oracle Cloud Infrastructure Full Stack Disaster Recovery Service 是 OCI 灾难恢复业务流程和管理服务,可为应用程序堆栈的所有层(包括基础结构、中间件、数据库和应用程序)提供全面的灾难恢复功能。

推荐

使用以下建议作为起点。 您的要求可能与此处描述的体系结构不同。
  • VCN

    创建 VCN 时,请根据您计划附加到 VCN 中子网的资源数量,确定所需的 CIDR 块数和每个块的大小。使用标准专用 IP 地址空间内的 CIDR 块。

    选择不与要设置专用连接的任何其他网络(在 Oracle Cloud Infrastructure 、您的内部部署数据中心或其他云提供商中)重叠的 CIDR 块。

    创建 VCN 后,您可以更改、添加和删除其 CIDR 块。

    设计子网时,请考虑流量和安全要求。将特定层或角色中的所有资源附加到可以用作安全边界的同一子网。

  • 安全

    使用 Oracle Cloud Guard 主动监视和维护 Oracle Cloud Infrastructure (OCI) 中资源的安全性。Oracle Cloud Guard 使用检测器配方,您可以定义这些配方来检查资源是否存在安全漏洞,以及监视操作员和用户是否有风险活动。检测到任何配置错误或不安全活动时,Oracle Cloud Guard 会根据您可以定义的响应器配方推荐更正操作并协助执行这些操作。

    对于需要最高安全性的资源,Oracle 建议您使用安全区域。安全区域是与 Oracle 定义的基于优秀实践的安全策略配方关联的区间。例如,安全区域中的资源必须无法从公共 Internet 访问,并且必须使用客户管理的密钥对它们进行加密。在安全区域中创建和更新资源时,OCI 会根据安全区域配方中的策略验证操作,并拒绝违反任何策略的操作。

  • Cloud Guard

    克隆和定制 Oracle 提供的默认配方,以创建定制检测器和响应器配方。通过这些配方,您可以指定哪种类型的安全违规会生成警告,以及允许对它们执行哪些操作。例如,您可能希望检测可见性设置为公共的对象存储桶。

    在租户级别应用 Cloud Guard,以涵盖最广泛的范围并减轻维护多个配置的管理负担。

    还可以使用“托管列表”功能将某些配置应用于检测器。

  • 安全区域

    对于需要最高安全性的资源,Oracle 建议您使用安全区域。安全区域是与 Oracle 定义的基于优秀实践的安全策略配方关联的区间。例如,安全区域中的资源必须无法从公共 Internet 访问,并且必须使用客户管理的密钥对它们进行加密。在安全区域中创建和更新资源时,Oracle Cloud Infrastructure 会根据安全区域配方中的策略验证操作,并拒绝违反任何策略的操作。

  • 网络安全组 (NSG)

    可以使用 NSG 定义一组适用于特定 VNIC 的入站和出站规则。我们建议使用 NSG 而非安全列表,因为 NSG 使您能够将 VCN 的子网体系结构与应用的安全要求分开。

  • 负载平衡器带宽

    创建负载平衡器时,您可以选择提供固定带宽的预定义配置,也可以指定定制(灵活)配置,在其中设置带宽范围并允许服务根据流量模式自动扩展带宽。通过任一方法,您都可以在创建负载平衡器后随时更改配置。

  • DNS 解析

    默认情况下,互联网和 VCN 解析程序不允许实例解析通过站点到站点 VPN 或 OCI FastConnect 连接到 VCN 的内部部署网络中的主机主机名。通过使用定制解析程序或配置 VCN 的专用 DNS 解析程序,可以实现此功能。

注意事项

部署此引用体系结构时,请考虑以下几点:

  • 计算实例

    OCI Full Stack Disaster Recovery Service 架构使用移动计算实例。在一般术语中,移动实例称为冷虚拟机 (Cold Virtual Machine,VM) 或 Pilot Light DR 拓扑。应用程序 VM 仅部署在主区域中。在 DR 运行时期间,将在备用区域创建 VM。必须在主区域和备用区域中创建具有 Oracle Data Guard 的 Oracle DB 系统。在实施 OCI Full Stack DR 解决方案之前,必须在一个 OCI 区域中安装并完全配置主 Oracle Hyperion Enterprise Performance Management System

  • 保护组

    创建两个 OCI Full Stack Disaster Recovery Service 保护组,每个区域一个。这些服务应包括:数据库、 OCI 计算、块存储、文件系统存储和负载平衡器。

  • 负载平衡器

    备用区域中的负载平衡器必须手动创建,但不能配置。OCI Full Stack Disaster Recovery Service 将在故障转移期间从主数据库复制到备用数据库。

  • 性能

    规划 RPO 和 RTO 时,请考虑跨区域复制存储备份所需的时间。

  • 可用性

    故障转移后,您可以利用定制 DNS 域设置将客户端流量重定向到新的生产区域。通过更新 DNS 条目以指向备用区域中应用程序主机的 IP 地址,客户机请求将自动路由到新活动区域。这可确保无缝重定向流量,而无需在客户端手动干预,从而最大限度地减少停机时间,并在故障转移过程中和之后保持服务可用性。

  • 数据库

    源数据库使用 Oracle Data Guard 进行同步,这可确保在主数据库和备用数据库之间持续复制。在故障转移期间, OCI Full Stack Disaster Recovery Service 会自动处理角色切换,从而将备用数据库提升为新的主数据库。为了确保平稳的故障转移和应用程序的连续性,主数据库和备用数据库必须使用相同的数据库服务名称。这样,应用和服务可以在故障转移后无缝连接到新的主数据库,而无需对连接配置进行任何更改,从而减少恢复过程中的停机时间和复杂性。

  • 计算服务

    故障转移后,需要将备用区域中应用层主机的 IP 地址映射到生产区域中的原始主机名。这样可以确保尝试使用原始生产主机名进行连接的任何系统、用户或服务都重定向到备用区域中的对应主机,现在这些主机充当新的活动环境。通过更新 DNS 记录或重新配置任何相关的网络设置以指向备用区域中的新 IP 地址,转换将变得无缝,从而尽可能减少对应用程序可用性和用户访问权限的中断。

浏览更多

了解有关 Oracle Hyperion Enterprise Performance Management SystemOracle Cloud Infrastructure (OCI) 和 OCI Full Stack Disaster Recovery Service 的更多信息,请参阅以下资源:

查看以下附加资源:

确认

  • 作者Grzegorz Reizer - EPM Specialist, OCI Specialist Team