成功执行接管操作后,辅助群集 cluster-newyork 将成为保护组的主群集,并且服务将在辅助群集上处于联机状态。恢复原来的主群集后,可使用故障恢复过程重新使服务在原来的主群集上联机。
Sun Cluster Geographic Edition 软件支持以下两种故障恢复:
故障恢复-切换。在故障恢复-切换期间,当使用辅助群集 cluster-newyork 上的数据对原主群集 cluster-paris 上的数据进行重新同步之后,应用程序将重新在原来的主群集上联机。
有关哪些群集是 cluster-paris 和 cluster-newyork 的提示信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Example Sun Cluster Geographic Edition Cluster Configuration”。
故障恢复-接管。在“故障恢复-接管”期间,在最初的主群集上应用程序再次进入联机状态,并在主群集上使用当前的数据。在辅助群集上进行的任何更新将被放弃。
当原来的主群集重新启动后,如果要使新的主群集 cluster-newyork 保持为主群集并使原来的主群集 cluster-paris 作为辅助群集,您可以重新同步和重新验证保护组配置,而无需执行切换或接管操作。
本节提供了以下信息:
可通过执行以下过程用当前主群集 cluster-newyork 上的数据重新同步和重新验证最初的主群集 cluster-paris 上的数据。
重新同步和重新验证保护组的配置之前,cluster-newyork 上已执行了接管操作。这些群集现在具有以下角色:
如果最初的主群集 cluster-paris 已关闭,请确认是否已引导该群集以及是否已在该群集上启用 Sun Cluster Geographic Edition 基础结构。有关如何引导群集的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Booting a Cluster”。
cluster-newyork 上保护组的角色为 primary。
cluster-paris 上保护组的角色为 primary 或 secondary,具体值取决于在 cluster-newyork 上执行接管操作期间是否可以对 cluster-paris 进行访问。
将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。
群集 cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。重新同步伙伴关系和保护组配置。
在 cluster-paris 上,取消激活本地群集上的保护组。
# geopg stop -e Local protectiongroupname |
指定命令的范围。
指定 local 范围后,该命令将仅在本地群集上有效。
指定保护组的名称。
如果已取消激活该保护组,则保护组中资源组的状态可能为 Error。状态为 Error,原因是应用程序资源组处于被管理和脱机状态。
取消激活保护组将导致应用程序资源组不再受到管理,并且清除 Error 状态。
在 cluster-paris 上重新同步伙伴关系。
# geops update partnershipname |
指定伙伴关系的名称。
此步骤只需执行一次即可,即使是要重新同步多个保护组亦是如此。
有关如何同步伙伴关系的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Resynchronizing a Partnership”。
在 cluster-paris 上重新同步每个保护组。
由于在 cluster-newyork 上保护组的角色为 primary,因而此步骤可确保在 cluster-paris 上保护组的角色为 secondary。
# geopg update protectiongroupname |
指定保护组的名称
有关对保护组进行同步的更多信息,请参见重新同步 Sun StorageTek Availability Suite 保护组。
在 cluster-paris 上,验证每个保护组的配置。
# geopg validate protectiongroupname |
指定标识单个保护组的唯一名称
有关更多信息,请参见如何验证 Sun StorageTek Availability Suite 保护组。
在 cluster-paris 上激活每个保护组。
在激活保护组时,它的应用程序资源组也会进入联机状态。
# geopg start -e Global protectiongroupname |
指定命令的范围。
通过指定 Global 范围,该命令在部署了保护组的两个群集上生效。
指定保护组的名称。
由于需要将数据从当前的主群集 cluster-newyork 同步到当前的辅助群集 cluster-paris,因此请不要使用 -n 选项。
由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。
有关 geopg start 命令的更多信息,请参见如何激活 Sun StorageTek Availability Suite 保护组。
确认数据已完全同步。
首先,确认在 cluster-newyork 上保护组的状态为 OK。
phys-newyork-1# geoadm status |
参阅输出的 Protection Group 部分。
下一步,确认复制资源组 AVSprotectiongroupname-rep-rg 中的所有资源是否均报告 OK 状态。
phys-newyork-1# clresource status -v AVSdevicegroupname-rep-rs |
当使用当前主群集 cluster-newyork 上的数据重新同步原主群集 cluster-paris 上的数据后,可执行本过程在原主群集上重新启动应用程序。
故障恢复过程仅适用于处在伙伴关系中的群集。对于每个伙伴关系而言,以下过程只需执行一次。
在执行“故障恢复-切换”前,在 cluster-newyork 上已进行了接管操作。这些群集现在具有以下角色:
如果最初的主群集 cluster-paris 发生了故障,请确认是否已引导该群集以及是否已在该群集上启用 Sun Cluster Geographic Edition 基础结构。有关如何引导群集的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Booting a Cluster”。
cluster-newyork 上保护组的角色为 primary。
cluster-paris 上的保护组的角色为 primary 或 secondary,具体值取决于在 cluster-newyork 上执行接管操作期间是否可以对 cluster-paris 进行访问。
将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。
群集 cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。重新同步伙伴关系和保护组配置。
在 cluster-paris 上重新同步伙伴关系。
phys-paris-1# geops update partnershipname |
指定伙伴关系的名称。
对于每个伙伴关系而言,即使是要对该伙伴关系中的多个保护组执行“故障恢复-切换”操作,也只需为该伙伴关系执行一次此步骤即可。
有关如何同步伙伴关系的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Resynchronizing a Partnership”。
确定原始主群集 cluster-paris 上的保护组是否处于活动状态。
phys-paris-1# geoadm status |
如果原始主群集上的保护组处于活动状态,则将其停止。
phys-paris-1# geopg stop -e local protectiongroupname |
指定命令的范围。
指定 local 范围后,该命令将仅在本地群集上有效。
指定保护组的名称。
如果已取消激活该保护组,则保护组中资源组的状态可能为 Error。状态为 Error,原因是应用程序资源组处于被管理和脱机状态。
取消激活保护组将导致应用程序资源组不再受到管理,并且清除 Error 状态。
检验保护组是否已停止。
phys-paris-1# geoadm status |
在 cluster-paris 上重新同步每个保护组。
由于保护组在 cluster-newyork 上的本地角色现在为 primary 角色,因而此步骤可确保它在 cluster-paris 上成为 secondary 角色。
phys-paris-1# geopg update protectiongroupname |
指定保护组的名称
有关对保护组进行同步的更多信息,请参见重新同步 Sun StorageTek Availability Suite 保护组。
在 cluster-paris 上,验证每个保护组的配置。
由于保护组处于错误状态时是无法启动的,因此,请确保保护组不处于错误状态。
phys-paris-1# geopg validate protectiongroupname |
指定标识单个保护组的唯一名称
有关更多信息,请参见如何验证 Sun StorageTek Availability Suite 保护组。
在 cluster-paris 上激活每个保护组。
在激活保护组时,它的应用程序资源组也会进入联机状态。
phys-paris-1# geopg start -e Global protectiongroupname |
指定命令的范围。
通过指定 Global 范围,该命令在部署了保护组的两个群集上生效。
指定保护组的名称。
请勿在执行“故障恢复-切换”操作时使用 -n 选项,因为需要从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 同步数据。
由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。
有关 geopg start 命令的更多信息,请参见如何激活 Sun StorageTek Availability Suite 保护组。
确认数据已完全同步。
首先,确认在 cluster-newyork 上保护组的状态为 OK。
phys-newyork-1# geoadm status |
参阅输出的 Protection Group 部分。
下一步,确认复制资源组 AVSprotectiongroupname-rep-rg 中的所有资源是否均报告 OK 状态。
phys-newyork-1# clresource status -v AVSdevicegroupname-rep-rs |
确保两个伙伴群集上的保护组处于激活状态。
# geoadm status |
在任一个群集上,为每个保护组从 cluster-newyork 到 cluster-paris 执行切换操作。
# geopg switchover [-f] -m clusterparis protectiongroupname |
有关更多信息,请参见如何将 Sun StorageTek Availability Suite 保护组从主群集切换到辅助群集。
cluster-paris 承担其作为保护组主群集的最初角色。
确保成功执行了切换操作。
检验保护组此时在 cluster-paris 上是否为主角色,在 cluster-newyork 上是否为辅助角色,并检验其在两个群集上的“数据复制”状态和“资源组”状态是否均为 OK。
# geoadm status |
查看每个 Sun StorageTek Availability Suite 保护组的应用程序资源组和数据复制的运行时状态。
# clresourcegroup status -v resourcegroupname # clresource status -v AVSdevicegroupname-rep-rs |
请参阅针对您要检查的数据复制设备组所显示的 Status 和 Status Message 字段。有关这些字段的更多信息,请参见表 2–1。
有关数据复制运行时状态的更多信息,请参见查看 Sun StorageTek Availability Suite 数据复制的运行时状态。
使用此过程在最初的主群集 cluster-paris 上重新启动应用程序,然后使用最初的主群集上的当前数据。在辅助群集 cluster-newyork 作为主群集时,在它的上面进行的任何更新均将被放弃。
故障恢复过程仅适用于处在伙伴关系中的群集。对于每个伙伴关系而言,以下过程只需执行一次。
在有些情况下,您可以继续使用原主群集 cluster-paris 上的数据。在 cluster-newyork 上执行接管操作后,不要从新的主群集 cluster-newyork 向原主群集 cluster-paris 复制数据。
开始执行“故障恢复-接管”操作之前,群集角色如下:
如果最初的主群集 cluster-paris 发生了故障,请确认是否已引导该群集以及是否已在该群集上启用 Sun Cluster Geographic Edition 基础结构。有关如何引导群集的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Booting a Cluster”。
在 cluster-newyork 上保护组的角色为 primary。
在 cluster-paris 上保护组的角色为 primary 或 secondary,这取决于在执行接管操作期间是否可以访问该保护组。
将最初的主群集 cluster-paris 与最初的辅助群集 cluster-newyork 进行重新同步。
cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。
在 cluster-paris 上重新同步伙伴关系。
phys-paris-1# geops update partnershipname |
指定伙伴关系的名称。
对于每个伙伴关系而言,即使是要对该伙伴关系中的多个保护组执行“故障恢复-接管”操作,也只需为该伙伴关系执行一次此步骤即可。
有关如何同步伙伴关系的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Resynchronizing a Partnership”。
确定原始主群集 cluster-paris 上的保护组是否处于活动状态。
phys-paris-1# geoadm status |
如果原始主群集上的保护组处于活动状态,则将其停止。
phys-paris-1# geopg stop -e local protectiongroupname |
检验保护组是否已停止。
phys-paris-1# geoadm status |
在 cluster-paris 上重新同步每个保护组。
如果已激活保护组,请使用 geopg stop 命令取消激活该保护组。有关取消激活保护组的更多信息,请参见如何取消激活 Sun StorageTek Availability Suite 保护组。
phys-paris-1# geopg update protectiongroupname |
指定保护组的名称
有关对保护组进行同步的更多信息,请参见如何重新同步 Sun StorageTek Availability Suite 保护组。
在 cluster-paris 上,验证每个保护组的配置。
因此,请确保保护组不是处于错误状态。保护组处于错误状态时是无法启动的。
phys-paris-1# geopg validate protectiongroupname |
指定标识单个保护组的唯一名称
有关更多信息,请参见如何验证 Sun StorageTek Availability Suite 保护组。
在 cluster-paris 上,在没有进行数据复制的情况下激活辅助角色中的每个保护组。
由于 cluster-paris 上保护组的角色为 secondary,因此 geopg start 命令不会在 cluster-paris 上重新启动应用程序。
phys-paris-1# geopg start -e local -n protectiongroupname |
指定命令的范围。
指定 local 范围后,该命令将仅在本地群集上有效。
防止在启动保护组时启动数据复制。
您必须使用 -n 选项。
指定保护组的名称。
有关更多信息,请参见如何激活 Sun StorageTek Availability Suite 保护组。
由于在 cluster-paris 上使用了 -n 选项,因此不会启动从 cluster-newyork 到 cluster-paris 的复制。
在 cluster-paris 上,为每个保护组执行接管操作。
phys-paris-1# geopg takeover [-f] protectiongroupname |
在不经您确认的情况下强制该命令执行操作
指定保护组的名称
有关 geopg takeover 命令的更多信息,请参见如何强制辅助群集立即接管 Sun StorageTek Availability Suite 服务。
此时 cluster-paris 上保护组的角色为 primary,cluster-newyork 上保护组的角色为 secondary。
在 cluster-paris 上激活每个保护组。
由于 cluster-newyork 上保护组的角色为 secondary,因此 geopg start 命令不会在 cluster-newyork 上重新启动应用程序。
phys-newyork-1# geopg start -e local [-n] protectiongroupname |
指定命令的范围。
指定 local 范围后,该命令将仅在本地群集上有效。
防止在启动保护组时启动数据复制。
如果省略此选项,则在启动保护组时会启动数据复制子系统。
指定保护组的名称。
有关 geopg start 命令的更多信息,请参见如何激活 Sun StorageTek Availability Suite 保护组。
启动数据复制。
要启动数据复制,请激活主群集 cluster-paris 上的保护组。
phys-paris-1# geopg start -e local protectiongroupname |
有关 geopg start 命令的更多信息,请参见如何激活 Sun StorageTek Availability Suite 保护组。
针对每个群集,检验保护组的设置是否正确,应用程序资源组的状态和数据复制的状态是否均为正常。
检验保护组此时在 cluster-paris 上是否为主角色,在 cluster-newyork 上是否为辅助角色。请从每个群集中的某一节点上运行以下命令:
# geoadm status |
查看每个 Sun StorageTek Availability Suite 保护组的应用程序资源组和数据复制的运行时状态。请从每个群集中的某一节点上运行以下命令:
# clresourcegroup status -v resourcegroupname # clresource status -v AVSdevicegroupname-rep-rs |
请参阅要查看的数据复制设备组所对应的 "Status" 和 "Status Message" 字段。有关这些字段的更多信息,请参见表 2–1。
有关数据复制运行时状态的更多信息,请参见查看 Sun StorageTek Availability Suite 数据复制的运行时状态。