本章介绍在使用 Sun Cluster Geographic Edition 产品之前您应当了解的一些主要概念。这些概念有助于您理解 Sun Cluster Geographic Edition 各个组件之间的相互关系。
本章包含以下几节:
数据复制操作可以以受控方式将生产服务从主群集迁移到辅助群集。这一操作既可在发生灾难时执行,也可作为计划过程中的一部分执行。系统将以同步、异步或同步异步组合的方式从主群集向辅助群集连续复制数据。具体的复制方式取决于群集所支持的应用服务的目标恢复点。
Sun Cluster Geographic Edition 软件支持使用 Sun StorEdge Availability Suite 3.2.1 软件、Hitachi TrueCopy 和 EMC Symmetrix Remote Data Facility 软件进行数据复制。Sun StorEdge Availability Suite 3.2.1 软件是基于主机的数据复制工具,该工具可在操作系统内的文件系统或逻辑卷级别上复制数据。Hitachi TrueCopy 软件和 EMC Symmetrix Remote Data Facility 软件是基于存储的数据复制工具,它们可在存储系统级别上复制数据,并可为应用程序提供透明服务。
Sun StorEdge Availability Suite 3.2.1 软件是基于主机的复制工具,它可以在处于不同地理位置的主群集和辅助群集之间实时复制磁盘卷。远程镜像复制通过 TCP/IP 连接,可以将数据从主群集的主卷复制到处于不同地理位置的辅助群集的主卷上。该软件使用远程镜像位图来跟踪主磁盘上的主卷与辅助磁盘上的主卷之间的差别。
在应用程序存取数据卷的同时,远程镜像软件将数据持续不断地复制到远程站点。您也可以通过运行命令手动更新辅助站点卷上的数据,以使主站点和辅助站点的卷同步。您还可以通过运行命令将数据从辅助卷恢复到主卷上,从而对卷进行反向同步。有关 Sun StorEdge Availability Suite 3.2.1 软件的详细信息,请参阅其产品文档。
Hitachi TrueCopy 软件是一个基于存储器的复制工具,它能够对处于不同地理位置的群集进行与主机无关的数据复制。在数据复制期间,Hitachi TrueCopy 软件允许主卷对于所有主机保持联机状态,并允许对主卷继续进行读写 I/O 操作。如果发生灾难或系统故障,本软件将运行数据的辅助副本以进行恢复操作,同时使数据损失降至最低。有关 Hitachi TrueCopy 软件的详细信息,请参阅其产品文档。
EMC Symmetrix Remote Data Facility 软件可为灾难恢复操作提供远程存储复制,并可通过远程站点故障转移功能来确保数据和系统的可用性。EMC Symmetrix Remote Data Facility 设备是成对配置的。一旦 EMC Symmetrix Remote Data Facility 链路处于联机状态,成对设备之间的镜像关系就会起作用。EMC Symmetrix Remote Data Facility 全局内存存储了正在运行的 EMC Symmetrix Remote Data Facility 设备对的状态信息。有关 EMC Symmetrix Remote Data Facility 软件的详细信息,请参阅其产品文档。
Sun Cluster Geographic Edition 软件借助资源组和设备组来管理群集之间的数据复制和 takeover。您还可以配置保护组,以便将数据从主群集复制到辅助群集。有关配置数据复制的详细信息,请参见您所使用的数据复制产品的相应指南:
Sun Cluster Geographic Edition 软件扩展了 Sun Cluster 的资源管理特性以集成数据复制产品。在配置保护组时,Sun Cluster Geographic Edition 软件会创建复制资源组,用来监视和控制数据复制。
设备组是一种由 Sun Cluster 管理的硬件资源。设备组是一种全局设备,Sun Cluster 软件可用它来注册卷管理器磁盘组。Sun Cluster Geographic Edition 软件将对 Sun Cluster 设备组进行配置,使其包括复制功能。有关如何在 Sun Cluster 中配置设备组的详细信息,请参见您所使用的数据复制产品的相应指南:
伙伴关系可在运行 Sun Cluster Geographic Edition 软件的两个群集之间建立心跳监视。伙伴关系中的群集会互相交换心跳,以便监视对方的存在和运行状况。您只能在两个群集之间配置伙伴关系,而且只能在这两个群集之间定义一个伙伴关系。这两个群集之间必须有 Internet 连接。通过伙伴关系可以在群集之间建立心跳。
Sun Cluster Geographic Edition 软件通过伙伴群集之间的 IP 互连进行管理和建立心跳。当使用公共网络时,可通过 IPsec 对 IP 互连加以保护,从而提高安全性。
您可以指定一个命令,使 Sun Cluster Geographic Edition 软件在发出心跳丢失通知的同时执行该命令。该命令将以超级用户的权限执行。您也可以指定一个电子邮件地址列表,使该软件在发出心跳丢失通知的同时以电子邮件的方式通知列表中的联系人。
下图直观地说明了两个群集之间的伙伴关系。
一个群集可以与其他群集构成多个伙伴关系,但是两个群集之间只能建立一个伙伴关系。
保护组通过管理服务的资源组,可以使一组群集克服灾难并实现灾后恢复。保护组只能存在于伙伴关系中。因此必须先创建一个伙伴关系,然后才能为该伙伴关系创建保护组。一个伙伴群集为保护组中的主群集,另一个伙伴群集则为辅助群集。保护组包含应用程序资源组和用于管理这些应用程序资源组之间数据复制的属性。必须在伙伴群集之间互相复制应用程序资源组配置。伙伴群集上的保护组配置是完全相同的,因此伙伴群集必须在其配置中定义保护组的应用程序资源组。Sun Cluster Geographic Edition 软件在伙伴群集之间传播保护组配置。
您可以在保护组中指定一种数据复制类型,以表明用于在伙伴群集之间进行数据复制的机制。一个保护组仅支持一种数据复制类型。一个保护组可以管理一个或多个应用程序资源组。为通过数据复制使服务免受灾难影响,保护组还需包含复制资源组。保护组将资源组中的应用程序链接到应该复制的应用程序数据。通过这种链接和复制,能够使应用程序从一个群集无缝地故障转移到另一个群集。
保护组中的群集必须被定义为伙伴群集。因此为容纳保护组,首先需要在群集之间定义一个伙伴关系。一个群集可以属于多个保护组,且该群集在每个保护组中可以扮演不同的角色。例如:一个保护组中的主群集可以是另一个保护组中的辅助群集。一个伙伴关系可以拥有任意多个保护组。
下图直观地说明了一个群集伙伴关系中的两个群集,该伙伴关系中定义了两个保护组。
下图直观地说明了两个群集伙伴关系中的三个群集,这两个伙伴关系中定义了两个保护组。
Sun Cluster Geographic Edition 软件监视着每个群集中的保护组的状态。然后,该软件将每个群集的本地状态综合成一个保护组状态的全局视图。全局状态反映了保护组的整体状态。
您可以在 SunPlex Manager GUI 中或通过 CLI 查看保护组状态。
有关保护组状态的详细信息,请参见《Sun Cluster Geographic Edition 系统管理指南》。
为获得高可用性,必须将应用程序作为一种资源在应用程序资源组中进行管理。您可以为 takeover 应用程序或可伸缩应用程序配置应用程序资源组。您还必须在主群集和辅助群集上同时配置应用程序资源和应用程序资源组。而且,应用程序资源所存取的数据也必须被复制到辅助群集上。
应用程序资源所存取的数据卷的副本必须与这些应用程序处于同一保护组中。
对数据复制的支持能力可能会限制您配置应用程序资源组的方式。这些要求和限制因所选的数据复制类型而有所不同。有关这些要求的详细信息,请参见《Sun Cluster Geographic Edition 系统管理指南》。
Sun Cluster Geographic Edition 软件使用心跳来监视伙伴群集之间的状态。心跳是通过公共网络发送出来的,用于检测发生在处于不同地理位置的站点上的群集故障。心跳监视是伙伴关系配置的一部分。例如,如果一个群集的所有节点均关闭,则会发生群集故障。Sun Cluster Geographic Edition 软件使用心跳状态将故障通知给管理员;或者触发一个向备用站点的辅助群集的故障转移。如果群集失去与公共网络的通信联系,导致伙伴群集之间无法通信时,则心跳也会丢失。
心跳监视器使用插件模块来查询其伙伴的心跳状态。Sun Cluster Geographic Edition 软件提供的默认插件可通过 TCP/UDP 连接来进行心跳状态监视。
您也可以使用自定义插件提供通往备用通信链路(如电子邮箱、HTTP、卫星和微波发射塔等)的数据路径。