Sun Cluster Geographic Edition 数据复制指南(适用于 EMC Symmetrix Remote Data Facility)

在使用 EMC Symmetrix Remote Data Facility 复制的系统上恢复对群集的服务

成功执行接管操作后,辅助群集 cluster-newyork 将成为保护组的主群集,因此服务将在辅助群集上处于联机状态。恢复原来的主群集 cluster-paris 后,通过使用所谓的故障恢复进程,在原来的主群集上可以使服务再次进入联机状态。

Sun Cluster Geographic Edition 软件支持以下两种故障恢复:

当原来的主群集重新启动后,如果要使新的主群集 cluster-newyork 保持为主群集并使原来的主群集 cluster-paris 作为辅助群集,您可以重新同步和重新验证保护组配置,而无需执行切换或接管操作。

Procedure如何重新同步和重新验证保护组的配置

可通过执行以下过程用当前主群集 cluster-newyork 上的数据重新同步和重新验证最初的主群集 cluster-paris 上的数据。

开始之前

重新同步和重新验证保护组的配置之前,cluster-newyork 上已执行了接管操作。这些群集现在具有以下角色:

  1. 将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。

    cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。重新同步伙伴关系和保护组配置。

    1. cluster-paris 上重新同步伙伴关系。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      指定伙伴关系的名称。


      注 –

      此步骤只需执行一次即可,即使是要重新同步多个保护组亦是如此。


      有关对伙伴关系进行同步的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“重新同步伙伴关系”

    2. cluster-paris 上重新同步每个保护组。

      由于在 cluster-newyork 上保护组的角色为 primary,因此此步骤可确保在 cluster-paris 上保护组的角色为 secondary


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      指定保护组的名称

      有关如何同步保护组的更多信息,请参见重新同步 EMC Symmetrix Remote Data Facility 保护组

  2. cluster-paris 上,验证每个保护组的群集配置。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    指定标识单个保护组的唯一名称

    有关更多信息,请参见如何验证 EMC Symmetrix Remote Data Facility 保护组

  3. cluster-paris 上激活每个保护组。

    由于 cluster-paris 上的保护组具有辅助角色,因此 geopg start 命令不会重新启动 cluster-paris 上的应用程序。


    phys-paris-1# geopg start -n -e local protectiongroupname
    
    -e local

    指定命令的范围。

    指定 local 范围后,该命令将仅在本地群集上有效。

    -n

    指定不能对该保护组进行数据复制。如果省略该选项,则数据复制将与保护组同时启动。

    protectiongroupname

    指定保护组的名称。

    由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。

    有关 geopg start 命令的更多信息,请参见如何激活 EMC Symmetrix Remote Data Facility 保护组

  4. 确认保护组配置是否正常。

    首先,确认在 cluster-newyork 上保护组的状态为 OK。当 cluster-newyork 上的 EMC Symmetrix Remote Data Facility 设备组的 EMC Symmetrix Remote Data Facility 设备对状态为 Synchronized 时,保护组的本地状态为 OK


    phys-newyork-1# geoadm status
    

    参阅输出的 Protection Group 部分。

    接下来,确认复制资源组 protectiongroupname-rep-rg 中的所有资源是否均会报告其状态为 OK


    phys-newyork-1# scstat -g
    

Procedure如何在使用 EMC Symmetrix Remote Data Facility 复制的系统上执行故障恢复-切换操作

当使用当前主群集 cluster-newyork 上的数据重新同步原主群集 cluster-paris 上的数据后,可执行本过程在原主群集上重新启动应用程序。


注 –

故障恢复过程仅适用于处在伙伴关系中的群集。对于每个伙伴关系而言,以下过程只需执行一次。


开始之前

在执行“故障转移-切换”前,在 cluster-newyork 上已进行了接管操作。群集具有以下角色:

  1. 将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。

    cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。重新同步伙伴关系和保护组配置。

    1. cluster-paris 上重新同步伙伴关系。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      指定伙伴关系的名称。


      注 –

      对于每个伙伴关系而言,即使是要对该伙伴关系中的多个保护组执行“故障恢复-切换”操作,也只需为该伙伴关系执行一次此步骤即可。


      有关对伙伴关系进行同步的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“重新同步伙伴关系”

    2. cluster-paris 上重新同步每个保护组。

      由于保护组在 cluster-newyork 上的本地角色现在为角色,因而此步骤可确保它在 cluster-paris 上成为辅助角色。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      指定保护组的名称

      有关如何同步保护组的更多信息,请参见重新同步 EMC Symmetrix Remote Data Facility 保护组

  2. cluster-paris 上,验证每个保护组的群集配置。

    因此,请确保保护组不处于错误状态。由于保护组处于错误状态时是无法启动的,


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    指定标识单个保护组的唯一名称

    有关更多信息,请参见如何验证 EMC Symmetrix Remote Data Facility 保护组

  3. cluster-paris 上激活每个保护组。

    由于 cluster-paris 上的保护组具有辅助角色,因此 geopg start 命令不会重新启动 cluster-paris 上的应用程序。


    phys-paris-1# geopg start -e local protectiongroupname
    
    -e local

    指定命令的范围。

    指定 local 范围后,该命令将仅在本地群集上有效。

    protectiongroupname

    指定保护组的名称。


    注 –

    执行“故障恢复-切换”操作时,因为需要在当前的主群集 cluster-newyork 和当前的辅助群集 cluster-paris 之间进行数据同步,所以请不要使用 -n 选项。


    由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。

    有关 geopg start 命令的更多信息,请参见如何激活 EMC Symmetrix Remote Data Facility 保护组

  4. 确认数据已完全同步。

    cluster-newyork 上保护组的状态为 OK 时,表明数据已完全同步。当 cluster-newyork 上 EMC Symmetrix Remote Data Facility 设备组的 RDF 设备对状态为 Synchronized 时,保护组的本地状态应为 OK

    要确认 cluster-newyork 上保护组的状态是否为 OK,请使用以下命令:


    phys-newyork-1# geoadm status
    

    参阅输出的 Protection Group 部分。

  5. 在任一个群集上,为每个保护组从 cluster-newyorkcluster-paris 执行切换操作。


    # geopg switchover [-f] -m clusterparis protectiongroupname
    

    有关更多信息,请参见如何将 EMC Symmetrix Remote Data Facility 保护组从主群集切换到辅助群集

    cluster-paris 承担其作为保护组主群集的最初角色。

  6. 确保成功执行了切换操作。

    检验保护组此时在 cluster-paris 上是否为主角色,在 cluster-newyork 上是否为辅助角色,并检验其在两个群集上的“数据复制”状态和“资源组”状态是否均为正常


    # geoadm status
    

    检查每个 EMC Symmetrix Remote Data Facility 保护组的应用程序资源组和数据复制的运行时状态。


    # scstat -g
    

    请参阅针对您要检查的数据复制设备组所显示的 StatusStatus Message 字段。有关这些字段的更多信息,请参见表 2–1

    有关数据复制运行时状态的更多信息,请参见检查 EMC Symmetrix Remote Data Facility 数据复制的运行时状态

Procedure如何在使用 EMC Symmetrix Remote Data Facility 复制的系统上执行故障恢复-接管操作

执行本过程可在原来的主群集 cluster-paris 上重新启动应用程序,并使用该群集上当前的数据。在辅助群集 cluster-newyork 作为主群集时,其上的所有更新都将被放弃。

故障恢复过程仅适用于处在伙伴关系中的群集。对于每个伙伴关系而言,以下过程只需执行一次。


注 –

如果要继续使用原主群集 cluster-paris 上的数据,则当您在 cluster-newyork 上进行接管以后,任何时候都不要执行从新主群集 cluster-newyork 到原主群集 cluster-paris 的数据复制。为避免在新主群集和原主群集之间进行数据复制,您必须在每次使用 geopg start 命令时都使用 -n 选项。


开始之前

确保群集具有以下角色:

  1. 将最初的主群集 cluster-paris 与最初的辅助群集 cluster-newyork 进行重新同步。

    cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。

    1. cluster-paris 上重新同步伙伴关系。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      指定伙伴关系的名称。


      注 –

      对于每个伙伴关系而言,即使是要对该伙伴关系中的多个保护组执行“故障恢复-接管”操作,也只需为该伙伴关系执行一次此步骤即可。


      有关对伙伴关系进行同步的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“重新同步伙伴关系”

    2. cluster-paris 上重新同步每个保护组。

      由于保护组在 cluster-newyork 上的本地角色现在为角色,因而此步骤可确保它在 cluster-paris 上成为辅助角色。


      phys-paris-1# geopg update protectiongroupname
      
      protectiongroupname

      指定保护组的名称

      有关重新同步保护组的更多信息,请参见如何重新同步保护组

  2. cluster-paris 上,验证每个保护组的配置。

    因此,请确保保护组不处于错误状态。由于保护组处于错误状态时是无法启动的,


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    指定标识单个保护组的唯一名称

    有关更多信息,请参见如何验证 EMC Symmetrix Remote Data Facility 保护组

  3. cluster-paris 上,在没有进行数据复制的情况下激活辅助角色中的每个保护组。

    由于 cluster-paris 上的保护组具有 secondary 角色,因此 geopg start 命令不会重新启动 cluster-paris 上的应用程序。


    注 –

    必须使用 -n 选项以指定不对此保护组进行数据复制。如果省略该选项,则数据复制将与保护组同时启动。



    phys-paris-1# geopg start -e local -n protectiongroupname
    
    -e local

    指定命令的范围。

    指定 local 范围后,该命令将仅在本地群集上有效。

    -n

    指定不能对该保护组进行数据复制。如果省略该选项,则数据复制将与保护组同时启动。

    protectiongroupname

    指定保护组的名称

    有关更多信息,请参见如何激活 EMC Symmetrix Remote Data Facility 保护组

    由于在 cluster-paris 上使用了 -n 选项,因此从 cluster-newyorkcluster-paris 的复制不会启动。

  4. cluster-paris 上,为每个保护组执行接管操作。


    phys-paris-1# geopg takeover [-f] protectiongroupname
    
    -f

    在不经您确认的情况下强制该命令执行操作

    protectiongroupname

    指定保护组的名称

    有关 geopg takeover 命令的更多信息,请参见如何强制辅助群集对 EMC Symmetrix Remote Data Facility 服务立即执行接管操作

    cluster-paris 上的保护组现在具有 primary 角色,而 cluster-newyork 上的保护组则具有 secondary 角色。在 cluster-paris 上,应用程序服务现在已处于联机状态。

  5. cluster-paris 上激活每个保护组。

    完成步骤 4 后,cluster-newyork 上保护组的本地状态为 Offline。要启动对保护组的本地状态的监视,您必须在 cluster-newyork 上激活保护组。

    由于 cluster-newyork 上的保护组具 secondary 角色,因此 geopg start 命令不会重新启动 cluster-newyork 上的应用程序。


    phys-newyork-1# geopg start -e local [-n] protectiongroupname
    
    -e local

    指定命令的范围。

    指定 local 范围后,该命令将仅在本地群集上有效。

    -n

    防止在启动保护组时启动数据复制。

    如果省略此选项,则在启动保护组时会启动数据复制子系统。

    protectiongroupname

    指定保护组的名称。

    有关 geopg start 命令的更多信息,请参见如何激活 EMC Symmetrix Remote Data Facility 保护组

  6. 确保已成功执行接管操作。

    检验保护组此时在 cluster-paris 上是否为主角色,在 cluster-newyork 上是否为辅助角色,并检验其在两个群集上的“数据复制”状态和“资源组”状态是否均为正常


    # geoadm status
    

    注 –

    如果在步骤 5 中使用了 -n 选项以防止启动数据复制,则“数据复制”状态将不会是 OK


    检查每个 EMC Symmetrix Remote Data Facility 保护组的应用程序资源组和数据复制的运行时状态。


    # scstat -g
    

    请参阅针对您要检查的数据复制设备组所显示的 StatusStatus Message 字段。有关这些字段的更多信息,请参见表 2–1

    有关数据复制运行时状态的更多信息,请参见检查 EMC Symmetrix Remote Data Facility 数据复制的运行时状态