使用 RackWare SWIFT 为 OCI Kubernetes Engine 构建灾难恢复解决方案

RackWare SWIFT 是一款全自动解决方案,可跨区域在 Oracle Cloud Infrastructure Kubernetes Engine (OKE) 设置之间实现备份和灾难恢复。RackWare SWIFT 使用灾难恢复策略来计划 OKE 工作负载的预定备份。在中断期间,将工作负载故障转移到远程云位置,并在几分钟内启动并运行。

RackWare SWIFT 独特的跨云和跨平台迁移技术使您能够将应用从一个容器平台无缝迁移到任何其他容器平台。

RackWare SWIFT 通过保护有状态和无状态 Kubernetes 对象,让您安心无忧。借助 RackWare SWIFT 为大规模停机而构建的灵活备份策略,您可以规划和确定满足需求的恢复时间目标/恢复点目标。

体系结构

此参考体系结构介绍了如何跨区域在 OKE 设置之间启用备份和灾难恢复。

备用区域配置为在发生灾难时传输 OKE 集群。此灾难恢复策略遵循主动/被动模型。主动/被动灾难恢复模型会创建一个备用区域,在声明灾难之前该区域不会在生产环境中运行。

下图说明了此引用体系结构。



灾难恢复 -oke-ra.zip

该体系结构具有以下组件:

  • Tenancy

    租户是 Oracle 在您注册 Oracle Cloud Infrastructure 时在 Oracle Cloud 中设置的安全隔离分区。您可以在您的租户内的 Oracle Cloud 中创建、组织和管理资源。租户是公司或组织的同义词。通常,公司将具有单个租户并反映其在该租户中的组织结构。单个租户通常与单个订阅关联,单个订阅通常只有一个租户。

  • 区域

    Oracle Cloud Infrastructure 区域是包含一个或多个数据中心(称为可用性域)的本地化地理区域。地区独立于其他地区,远距离可以把它们分开(跨越国家甚至大陆)。

  • 区间

    区间是 Oracle Cloud Infrastructure 租户中的跨区域逻辑分区。使用区间在 Oracle Cloud 中组织资源、控制对资源的访问并设置使用限额。要控制对给定区间中资源的访问,您可以定义策略来指定谁可以访问资源以及可以执行哪些操作。

  • 可用性域

    可用性域是区域中的独立数据中心。每个可用性域中的物理资源与其他可用性域中的资源隔离,从而提供容错能力。可用性域不共享电源或冷却设备等基础设施,也不共享内部可用性域网络。因此,一个可用性域失败不太可能影响区域中的其他可用性域。

  • 虚拟云网络 (VCN) 和子网

    VCN 是一个可定制的软件定义网络,您可以在 Oracle Cloud Infrastructure 区域中设置。与传统的数据中心网络一样,VCN 允许您完全控制您的网络环境。VCN 可以具有多个不重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 划分为子网,子网可以限定为区域或可用性域。每个子网都包含一系列不与 VCN 中的其他子网重叠的连续地址。可以在创建后更改子网的大小。子网可以是公共子网,也可以是专用子网。

  • 负载平衡器

    Oracle Cloud Infrastructure Load Balancing 服务提供从单个入口点到后端多个服务器的自动流量分配。

  • 安全列表

    对于每个子网,可以创建安全规则来指定必须允许进出子网的通信的源、目标和类型。

  • 网络地址转换 (NAT) 网关

    通过 NAT 网关,VCN 中的专用资源可以访问 Internet 上的主机,而不会向传入的 Internet 连接公开这些资源。

  • RackWare SWIFT

    在此体系结构中,RackWare SWIFT 可在主区域中搜索 OKE 集群并将其同步到备用区域。

  • Oracle Cloud Infrastructure Registry (OCIR)

    Oracle Cloud Infrastructure Registry 是一个由 Oracle 管理的注册表,可帮助您简化开发到生产工作流的过程。

推荐

使用以下建议作为起点。您的要求可能与此处所述的体系结构不同。
  • VCN

    创建 VCN 时,请根据您计划附加到 VCN 中子网的资源数量,确定所需的 CIDR 块数和每个块的大小。使用标准专用 IP 地址空间内的 CIDR 块。

    选择不与要设置专用连接的任何其他网络(在 Oracle Cloud Infrastructure 、您的内部部署数据中心或其他云提供商中)重叠的 CIDR 块。

    创建 VCN 后,您可以更改、添加和删除其 CIDR 块。

    设计子网时,请考虑流量和安全要求。将特定层或角色中的所有资源附加到可以用作安全边界的同一子网。

  • 安全区域

    对于需要最高安全性的资源,Oracle 建议您使用安全区域。安全区域是与 Oracle 定义的基于优秀实践的安全策略配方关联的区间。例如,安全区域中的资源必须无法从公共 Internet 访问,并且必须使用客户管理的密钥对它们进行加密。在安全区域中创建和更新资源时,Oracle Cloud Infrastructure 会根据安全区域配方中的策略验证操作,并拒绝违反任何策略的操作。

  • 负载平衡器带宽

    创建负载平衡器时,您可以选择提供固定带宽的预定义配置,也可以指定定制(灵活)配置,在其中设置带宽范围并允许服务根据流量模式自动扩展带宽。通过任一方法,您都可以在创建负载平衡器后随时更改配置。

  • Oracle Container Engine for Kubernetes

    Oracle Container Engine for Kubernetes (OKE) 是一款全托管式、可扩展的高可用性服务,您可以使用其将容器化应用部署到云。当您的开发团队想要可靠地构建、部署和管理云原生应用时,可使用 OKE。您可以指定应用所需的计算资源,OKE 在现有 OCI 租户的 Oracle Cloud Infrastructure 上预配这些资源。

  • 应用程序复制
    • 同步直通:将容器对象和数据从源同步到目标平台。
    • 阶段 1 :将容器对象和数据从源平台同步到 SWIFT。数据存储在 SWIFT 存储池中。
    • Stage-2 :SWIFT 存储池中存储的数据将同步到目标平台。
  • 注册表复制

    将图像从一个位置复制到另一个位置。

注意事项

部署此引用体系结构时,请考虑以下几点。

  • 同步

    需要先在辅助集群上创建名称空间,然后才能同步。每个同步作业支持一对一名称空间映射。在 RackWare SWIFT 可以将 OKE 集群同步到辅助区域之前,必须在辅助区域中创建 OKE 集群。

  • 基础结构

    您必须先在辅助区域中创建 VCN,然后才能同步这两个区域。

  • Kubernetes 集群信息

    请注意,RackWare 不会复制节点标签、节点分配、控制层定义或 worker 节点属性。这意味着您的 pod 拓扑、pod 分发、节点选择器以及关联性设置需要在辅助区域中手动维护。需要在该辅助位置设计和应用适当的资源分配和云池分配,以便在发生切换/故障转移时实现一致的行为。

部署

此参考架构示例在 Oracle Cloud Marketplace 中作为映像提供。
  1. 转至 Oracle Cloud Marketplace
  2. 单击获取应用程序
  3. 按照屏幕上的提示操作。

浏览更多

了解有关使用 RackWare SWIFT 为 OCI Kubernetes Engine 构建灾难恢复解决方案的更多信息。

查看以下附加资源:

确认

  • 作者:Saul Chavez
  • 贡献者:魏寒

更改日志

此日志列出了重大更改: