本章介绍可与 Sun Cluster 软件一起使用的数据复制技术。Sun Cluster 软件支持群集之间的数据复制(用于灾难恢复)或群集内的数据复制(作为基于主机的镜像的替代方法)。数据复制是指将数据从主存储设备复制到备份设备(即辅助设备)中。如果主设备发生故障,您可从辅助设备中获取数据。数据复制有助于确保群集的高可用性和容灾性 (disaster tolerance)。
您必须了解基于主机和基于存储的数据复制,才能选出最适合您的群集的复制方法。可以使用 Sun Cluster Geographic Edition 来管理数据复制;有关更多信息,请参见《Sun Cluster Geographic Edition Overview》。
本章包括以下各节:
Sun Cluster 支持以下数据复制方法:
基于主机的数据复制使用软件在地理位置分散的群集之间实时复制磁盘卷。远程镜像复制则可将数据从主群集的主卷复制到分散在不同地理位置的辅助群集的主卷上。该软件使用远程镜像位图来跟踪主磁盘上的主卷与辅助磁盘上的主卷之间的差别。例如,Sun StorageTek Availability Suite 4 和 Sun StorEdge Availability Suite 3.2.1 就是用于在群集之间(以及在群集与群集外的主机之间)进行复制的基于主机的复制软件。
由于基于主机的数据复制使用主机资源,而无需使用特殊的存储阵列,因此是一种花费不高的数据复制解决方案。如果数据库、应用程序或文件系统配置为允许运行 Solaris OS 的多个主机将数据写入到共享卷,则不支持这些数据库、应用程序或文件系统(例如,Oracle 9iRAC 和 Oracle Parallel Server)。有关在两个群集间使用基于主机的数据复制的更多信息,请参见《Sun Cluster Geographic Edition 数据复制指南(适用于 Sun StorageTek Availability Suite)》。要查看不使用 Sun Cluster Geographic Edition 的基于主机的复制示例,请参见附录 A,使用 Sun StorEdge Availability Suite 或 Sun StorageTek Availability Suite 软件配置基于主机的数据复制。
基于存储的数据复制使用存储控制器上的软件将数据复制工作从群集节点移至存储设备上。该软件可释放一些节点处理能力以响应群集请求。例如,Hitachi TrueCopy 和 EMC SRDF 就是可以在群集内部或在群集之间复制数据的基于存储的软件。基于存储的数据复制可能在校园群集配置中特别重要,并且可以简化所需的基础结构。有关在校园群集环境中使用基于存储的数据复制的更多信息,请参见在群集内使用基于存储的数据复制。
有关在两个或更多个群集之间使用基于存储的复制以及自动完成该过程的 Sun Cluster GeoEdition 产品的更多信息,请参见《Sun Cluster Geographic Edition 数据复制指南(适用于 Hitachi TrueCopy)》和《Sun Cluster Geographic Edition 数据复制指南(适用于 EMC Symmetrix Remote Data Facility)》。有关此类型的群集配置的完整示例,另请参见使用 Sun StorEdge Availability Suite 或 Sun StorageTek Availability Suite 软件配置基于主机的数据复制。
Sun Cluster 软件支持群集之间或群集内的下列数据复制方法:
群集之间的复制-对于灾难恢复,您可以使用基于主机或基于存储的复制方法在群集之间执行数据复制。通常,您会选择基于主机的复制或基于存储的复制,而不是使用二者的组合。使用 Sun Cluster Geographic Edition 软件可以管理这两种类型的复制。
基于主机的复制
Sun StorageTek Availability Suite 4,从 Solaris 10 OS 开始
Solaris 9 OS 上的 Sun StorEdge Availability Suite 3.2.1
在本手册中,除非另有明确说明,否则有关 Sun StorageTek Availability Suite 软件的参考内容同样适用于 Sun StorEdge Availability Suite 软件。
如果要在不使用 Sun Cluster Geographic Edition 软件的情况下使用基于主机的复制,请参见附录 A,使用 Sun StorEdge Availability Suite 或 Sun StorageTek Availability Suite 软件配置基于主机的数据复制中的说明。
基于存储的复制
Hitachi TrueCopy,通过 Sun Cluster Geographic Edition
EMC Symmetrix Remote Data Facility (SRDF),通过 Sun Cluster Geographic Edition
如果要在不使用 Sun Cluster Geographic Edition 软件的情况下使用基于存储的复制,请参见复制软件的相关文档。
群集内的复制-此方法用作基于主机的镜像的替代方法。
基于应用程序的复制-Oracle Data Guard 是基于应用程序的复制软件的一个示例。这一类型的软件仅用于灾难恢复。有关更多信息,请参见《Sun Cluster Geographic Edition 数据复制指南(适用于 Oracle Data Guard)》。
基于存储的数据复制使用安装在存储设备上的软件来管理群集或校园群集内的复制。此类软件是特定存储设备所特有的,不用于灾难恢复。配置基于存储的数据复制时,请参阅存储设备附带的相关文档。
根据所用的软件,您可以在基于存储的数据复制中使用自动故障转移或手动故障转移。Sun Cluster 支持使用 Hitachi TrueCopy 和 EMC SRDF 软件对复制数据进行手动故障转移和自动故障转移。
本节介绍了校园群集中使用的基于存储的数据复制。图 4–1 显示了在两个存储阵列间复制数据的双工作间配置样例。在此配置中,主存储阵列位于第一个工作间,并在此向两个工作间中的节点提供数据。此外,主存储阵列还为辅助存储阵列提供要复制的数据。
图 4–1 显示出法定设备在非复制卷上。复制的卷不能用作法定设备。
使用 Hitachi TrueCopy 的基于存储的数据复制可以在 Sun Cluster 环境中同步或异步执行,具体取决于您使用的应用程序的类型。如果要在校园群集中执行自动故障转移,请同步使用 TrueCopy。使用 EMC SRDF 进行的基于存储的同步复制由 Sun Cluster 提供支持;对于 EMC SRDF,不支持异步复制。
为确保数据完整性,请使用多路径和正确的 RAID 软件包。如果要使用基于存储的数据复制实现群集配置,请注意以下事项:
节点到节点的距离受 Sun Cluster 光纤通道和互连基础结构的限制。要了解当前的限制和支持技术的更多信息,请联系您的 Sun 服务提供商。
不要将复制卷配置为法定设备。应使任何法定设备位于共享的非复制卷中或使用法定服务器。
确保只有数据的主副本对群集节点可见。否则,卷管理器可能尝试同时访问数据的主副本和辅助副本。有关控制数据副本可见性的相关信息,请参阅存储阵列附带的相关文档。
EMC SRDF 和 Hitachi TrueCopy 允许用户定义复制的设备组。对于复制设备组和 Sun Cluster 全局设备组,必须给定相同的名称,以便可以在节点之间作为一个单元来移动它们。
某些应用程序特定数据可能不适合进行异步数据复制。请根据您对应用程序行为的了解来确定在存储设备间复制应用程序特定数据的最佳方式。
如果配置群集进行自动故障转移,请使用同步复制。
有关配置群集以进行复制卷自动故障转移的说明,请参见管理基于存储的复制设备。
在群集内部进行复制时,SRDF 和 Hitachi TrueCopy 不支持 Oracle Real Application Clusters (RAC)。连接到当前非主副本的节点将不具有写入权限。复制设备无法支持任何要求群集的所有节点都具有直接写入权限的可伸缩应用程序。
不支持 Sun Cluster 软件的 Veritas Cluster Volume Manager (CVM) 和 Solaris Volume Manager (SVM) OBAN 群集。
与所有校园群集一样,通常,使用基于存储的数据复制的群集在遇到单一故障时无需人为干预。但是,如果使用手动故障转移,又无法进入主存储设备所在的工作间(如图 4–1 所示),则双节点群集便会出现问题。剩下的节点无法保留法定设备,也无法作为群集成员进行引导。此时,需要对群集进行以下人为干预:
您的 Sun 服务提供商必须重新配置剩下的节点,使之作为群集成员进行引导。
您或您的 Sun 服务提供商必须将一个辅助存储设备的非复制卷配置为法定设备。
您或您的 Sun 服务提供商必须配置剩下的节点,使之将辅助存储设备用作主存储。这种重新配置可能涉及重新构建卷管理器卷、恢复数据或更改应用程序与存储卷的关联。
当设置使用 Hitachi TrueCopy 软件进行基于存储的数据复制的设备组时,请遵循以下做法:
请使用同步复制,以避免在主站点发生故障时可能丢失数据。
horcm 配置文件中定义的 Sun Cluster 全局设备组和 TrueCopy 复制组之间应存在一对一的关系。这样,两个组便可以作为一个单元在节点间移动。
不能在同一复制设备组中混用全局文件系统卷和故障转移文件系统卷,因为它们的控制方式不同。全局文件系统是通过设备配置系统 (Device Configuration System, DCS) 来控制的,而故障转移文件系统卷是通过 HAS+ 来控制的。每个文件系统的主节点可能是不同的节点,从而导致在应将哪个节点用作复制主节点这一问题上出现冲突。
所有 RAID 管理器实例均应启动并始终处于运行状态。
当使用 EMC SRDF 软件来进行基于存储的数据复制时,应使用动态设备而非静态设备。静态设备更改复制主副本需要几分钟,而这会影响故障转移时间。