成功地执行接管操作后,辅助群集 (cluster-newyork) 将成为保护组的主群集,并且辅助群集上的服务将处于联机状态。在最初的主群集cluster-paris 恢复以后,使用所谓的故障恢复进程可以使服务再次进入联机状态。
Sun Cluster Geographic Edition 软件支持以下两种故障恢复:
故障恢复-切换。在执行“故障恢复-切换”操作期间,最初主群集的数据与辅助群集 cluster-newyork 上的数据重新同步后,应用程序在最初的主群集 cluster-paris 上再次进入联机状态。
有关哪些群集是 cluster-paris 和 cluster-newyork 的提示信息,请参见图 2–1。
故障恢复-接管。在“故障恢复-接管”期间,最初的主群集 cluster-paris 上的应用程序将再次进入联机状态,这些应用程序将使用最初主群集上当前的数据。在辅助群集 cluster-newyork 作为主群集时,在它的上面进行的任何更新均将被放弃。
当最初的主群集上的数据与当前主群集 cluster-newyork 上的数据重新同步之后,使用此过程可重新启动最初的主群集 cluster-paris 上的应用程序。
在执行“故障转移-切换”前,在 cluster-newyork 上已进行了接管操作。这些群集现在具有以下角色:
如果最初的主群集 cluster-paris 已关闭,请确认是否已引导该群集以及是否已在该群集上启用 Sun Cluster Geographic Edition 基础结构。有关引导群集的更多信息,请参见引导群集。
cluster-newyork 上的保护组具有 primary 角色。
cluster-paris 上的保护组具有 primary 角色或 secondary 角色,这取决于在执行接管操作期间是否可以访问该保护组。
将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。
cluster-paris 放弃自己的配置,从本地复制 cluster-newyork 配置。重新同步伙伴关系和保护组配置。
在 cluster-paris 上重新同步伙伴关系。
# geops update partnership-name |
指定伙伴关系的名称。
即使您在为多个保护组执行“故障恢复-切换”操作,您也仅需要执行一次此步骤。
有关同步伙伴关系的更多信息,请参见重新同步伙伴关系。
在 cluster-paris 上重新同步每个保护组。
由于 cluster-newyork 上的保护组角色为 primary,因此该步骤可确保在 cluster-paris 上的保护组角色为 secondary。
# geopg update protection-group-name |
指定保护组的名称
有关同步保护组的更多信息,请参见重新同步 Hitachi TrueCopy 保护组。
在 cluster-paris 上,验证每个保护组的群集配置。
# geopg validate protection-group-name |
指定标识单个保护组的唯一名称
有关更多信息,请参见如何验证 Hitachi TrueCopy 保护组。
在 cluster-paris 上激活每个保护组。
由于 cluster-paris 上的保护组具辅助角色,因此 geopg start 命令不会重新启动 cluster-paris 上的应用程序。
# geopg start -e local protection-group-name |
指定命令的范围
指定 local 范围后,该命令将仅在本地群集上有效。
指定保护组的名称
进行“故障转移-切换”操作时,请不要使用 -n 选项,原因是需要从当前的主群集 cluster-newyork 到当前的辅助群集 cluster-paris 对数据进行同步。
由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。
有关 geopg start 命令的更多信息,请参见如何激活 Hitachi TrueCopy 保护组。
在执行切换操作前,请等待数据完全同步。
如果 cluster-newyork 上保护组的状态为 OK,表示数据已完全同步。cluster-newyork 上 Hitachi TrueCopy 设备组状态为 PVOL_PAIR,并且 cluster-paris 上 Hitachi TrueCopy 设备组状态为 SVOL_PAIR 时,保护组的本地状态为 OK。
为了确认 cluster-newyork 上保护组的状态是否为 OK,请使用以下命令:
phys-newyork-1# geoadm status |
参考输出内容中的 Protection Group 部分
在任一个群集上,为每个保护组从 cluster-newyork 到 cluster-paris 执行切换操作。
# geopg switchover [-f] -m cluster-paris protection-group-name |
有关更多信息,请参见如何将 Hitachi TrueCopy 保护组由主群集切换为辅助群集。
cluster-paris 承担其作为保护组主群集的最初角色。
使用此过程在最初的主群集 cluster-paris 上重新启动应用程序,并使用最初主群集上的当前数据。当辅助群集 cluster-newyork 充当主群集时,它上面发生的任何更新都将被废弃。
此外,您还可以在最初的主群集 cluster-paris 上继续使用数据。在 cluster-newyork 上执行接管操作后,肯定没有从新的主群集 cluster-newyork 向最初的主群集 cluster-paris 复制数据。为避免在新的主群集和最初的主群集之间进行数据复制,您必须在使用 geopg start 命令时使用 -n 选项。
执行“故障转移-接管”操作前,群集具有以下角色:
cluster-newyork 上的保护组具有 primary 角色。
cluster-paris 上的保护组具有 primary 角色或 secondary 角色,这取决于在执行接管操作期间是否可以访问该保护组。
将最初的主群集 cluster-paris 与最初的辅助群集 cluster-newyork 进行重新同步。
cluster-paris 放弃自己的配置,并从本地复制 cluster-newyork 的配置。
在 cluster-paris 上重新同步伙伴关系。
# geops update partnership-name |
指定伙伴关系的名称。
即使您在为多个保护组执行“故障恢复-接管”操作,您也仅需要执行一次此步骤。
有关同步伙伴关系的更多信息,请参见重新同步伙伴关系。
使 Hitachi TrueCopy 设备组 devgroup1 处于 SMPL 状态。
使用 pairsplit 命令使 cluster-paris 和 cluster-newyork 上的保护组中的 Hitachi TrueCopy 设备组处于 SMPL 状态。您使用的 pairsplit 命令取决于 Hitachi TrueCopy 设备组的配对状态。下表列出了针对部分典型配对状态,需要您在 cluster-paris 上使用的一些命令示例。
cluster-paris 上的配对状态 |
cluster-newyork 上的配对状态 |
在 cluster-paris 上使用的 pairsplit 命令 |
---|---|---|
PSUS 或 PSUE |
SSWS |
pairsplit -R -g dgname pairsplit -S -g dgname |
SSUS |
PSUS |
pairsplit -S -g dgname |
有关 pairsplit 命令的更多信息,请参见《Sun StorEdge SE 9900 V Series Command and Control Interface User and Reference Guide》。
如果命令成功,则 pairdisplay 命令的输出将显示 devgroup1 的状态,如下所示:
phys-paris-1# pairdisplay -g devgroup1 Group PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#,P/S,Status,Fence,Seq#,P-LDEV# M devgroup1 pair1(L) (CL1-A , 0, 1) 12345 1..SMPL ---- ----,----- ---- - devgroup1 pair1(R) (CL1-C , 0, 20)54321 609..SMPL ---- ----,----- ---- - devgroup1 pair2(L) (CL1-A , 0, 2) 12345 2..SMPL ---- ----,----- ---- - devgroup1 pair2(R) (CL1-C , 0,21) 54321 610..SMPL ---- ----,----- ---- - |
.
在 cluster-paris 上重新同步每个保护组。
由于 cluster-newyork 上的保护组的本地角色现在为 primary,因此该步骤可确保 cluster-paris 上的保护组的本地角色为 secondary。
# geopg update protection-group-name |
指定保护组的名称
有关重新同步保护组的更多信息,请参见如何重新同步保护组。
在 cluster-paris 上,验证每个保护组的群集配置。
# geopg validate protection-group-name |
指定标识单个保护组的唯一名称
有关更多信息,请参见如何验证 Hitachi TrueCopy 保护组。
在 cluster-paris 上,在不使用数据复制的情况下激活处于辅助角色的每个保护组。
由于 cluster-paris 上的保护组具 secondary 角色,因此 geopg start 命令不会重新启动 cluster-paris 上的应用程序。
# geopg start -e local -n protection-group-name |
指定命令的范围
指定 local 范围后,该命令将仅在本地群集上有效。
防止在启动保护组时启动数据复制
您必须使用 -n 选项。
指定保护组的名称
有关更多信息,请参见如何激活 Hitachi TrueCopy 保护组。
系统不会启动从 cluster-newyork 到 cluster-paris 的复制,因为 cluster-paris 上已指定 -n 选项。
在 cluster-paris 上,为每个保护组执行接管操作。
# geopg takeover [-f] protection-group-name |
在不经您确认的情况下强制该命令执行操作
指定保护组的名称
有关 geopg takeover 命令的更多信息,请参见如何强制辅助群集对 Hitachi TrueCopy 服务立即执行接管操作。
cluster-paris 上的保护组现在具 primary 角色,而 cluster-newyork 上的保护组则具 secondary 角色。在 cluster-paris 上,应用程序服务现已处于联机状态。
在 cluster-paris 上激活每个保护组。
完成步骤 4 后,cluster-newyork 上保护组的本地状态为 Offline。要启动对保护组的本地状态的监视,您必须在 cluster-newyork 上激活保护组。
由于 cluster-newyork 上的保护组具 secondary 角色,因此 geopg start 命令不会重新启动 cluster-newyork 上的应用程序。
# geopg start -e local [-n] protection-group-name |
指定命令的范围
指定 local 范围后,该命令将仅在本地群集上有效。
防止在启动保护组时启动数据复制
如果省略此选项,则在启动保护组时会启动数据复制子系统。
指定保护组的名称
有关 geopg start 命令的更多信息,请参见如何激活 Hitachi TrueCopy 保护组。