Sun Cluster Geographic Edition 数据复制指南(适用于 Sun StorageTek Availability Suite)

Procedure如何在使用 Sun StorageTek Availability Suite 复制的系统上执行“故障恢复-切换”操作

当使用当前主群集 cluster-newyork 上的数据重新同步原主群集 cluster-paris 上的数据后,可执行本过程在原主群集上重新启动应用程序。

故障恢复过程仅适用于处在伙伴关系中的群集。对于每个伙伴关系而言,以下过程只需执行一次。

开始之前

在执行“故障恢复-切换”前,在 cluster-newyork 上已进行了接管操作。这些群集现在具有以下角色:

  1. 将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。

    群集 cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。重新同步伙伴关系和保护组配置。

    1. cluster-paris 上重新同步伙伴关系。


      phys-paris-1# geops update partnershipname
      
      partnershipname

      指定伙伴关系的名称。


      注 –

      对于每个伙伴关系而言,即使是要对该伙伴关系中的多个保护组执行“故障恢复-切换”操作,也只需为该伙伴关系执行一次此步骤即可。


      有关如何同步伙伴关系的更多信息,请参见《Sun Cluster Geographic Edition System Administration Guide》中的“Resynchronizing a Partnership”

    2. 确定原始主群集 cluster-paris 上的保护组是否处于活动状态。


      phys-paris-1# geoadm status
      
    3. 如果原始主群集上的保护组处于活动状态,则将其停止。


      phys-paris-1# geopg stop -e local protectiongroupname
      
      -e local

      指定命令的范围。

      指定 local 范围后,该命令将仅在本地群集上有效。

      protectiongroupname

      指定保护组的名称。

      如果已取消激活该保护组,则保护组中资源组的状态可能为 Error。状态为 Error,原因是应用程序资源组处于被管理和脱机状态。

      取消激活保护组将导致应用程序资源组不再受到管理,并且清除 Error 状态。

    4. 检验保护组是否已停止。


      phys-paris-1# geoadm status
      
    5. cluster-paris 上重新同步每个保护组。

      由于保护组在 cluster-newyork 上的本地角色现在为 primary 角色,因而此步骤可确保它在 cluster-paris 上成为 secondary 角色。


      phys-paris-1# geopg update protectiongroupname 
      
      protectiongroupname

      指定保护组的名称

      有关对保护组进行同步的更多信息,请参见重新同步 Sun StorageTek Availability Suite 保护组

  2. cluster-paris 上,验证每个保护组的配置。

    由于保护组处于错误状态时是无法启动的,因此,请确保保护组不处于错误状态。


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    指定标识单个保护组的唯一名称

    有关更多信息,请参见如何验证 Sun StorageTek Availability Suite 保护组

  3. cluster-paris 上激活每个保护组。

    在激活保护组时,它的应用程序资源组也会进入联机状态。


    phys-paris-1# geopg start -e Global protectiongroupname
    
    -e Global

    指定命令的范围。

    通过指定 Global 范围,该命令在部署了保护组的两个群集上生效。

    protectiongroupname

    指定保护组的名称。


    注意 – 注意 –

    请勿在执行“故障恢复-切换”操作时使用 -n 选项,因为需要从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 同步数据。

    由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。

    有关 geopg start 命令的更多信息,请参见如何激活 Sun StorageTek Availability Suite 保护组


  4. 确认数据已完全同步。

    首先,确认在 cluster-newyork 上保护组的状态为 OK


    phys-newyork-1# geoadm status
    

    参阅输出的 Protection Group 部分。

    下一步,确认复制资源组 AVSprotectiongroupname-rep-rg 中的所有资源是否均报告 OK 状态。


    phys-newyork-1# clresource status -v AVSdevicegroupname-rep-rs
    
  5. 确保两个伙伴群集上的保护组处于激活状态。


    # geoadm status
    
  6. 在任一个群集上,为每个保护组从 cluster-newyorkcluster-paris 执行切换操作。


    # geopg switchover [-f] -m clusterparis protectiongroupname
    

    有关更多信息,请参见如何将 Sun StorageTek Availability Suite 保护组从主群集切换到辅助群集

    cluster-paris 承担其作为保护组主群集的最初角色。

  7. 确保成功执行了切换操作。

    检验保护组此时在 cluster-paris 上是否为主角色,在 cluster-newyork 上是否为辅助角色,并检验其在两个群集上的“数据复制”状态和“资源组”状态是否均为 OK


    # geoadm status
    

    查看每个 Sun StorageTek Availability Suite 保护组的应用程序资源组和数据复制的运行时状态。


    # clresourcegroup status -v resourcegroupname
    # clresource status -v AVSdevicegroupname-rep-rs
    

    请参阅针对您要检查的数据复制设备组所显示的 StatusStatus Message 字段。有关这些字段的更多信息,请参见表 2–1

    有关数据复制运行时状态的更多信息,请参见查看 Sun StorageTek Availability Suite 数据复制的运行时状态