Sun Cluster Geographic Edition 系统管理指南

在执行接管操作后恢复 Sun StorEdge Availability Suite 3.2.1 数据

成功地执行接管操作后,辅助群集 (cluster-newyork) 将成为保护组的主群集,并且辅助群集上的服务将处于联机状态。恢复最初的主群集后,通过使用所谓的故障恢复进程,在最初的主群集上可以使服务再次进入联机状态。

Sun Cluster Geographic Edition 软件支持以下两种故障恢复:

Procedure如何在使用 Sun StorEdge Availability Suite 3.2.1 复制的系统上执行“故障恢复-切换”操作

在此群集的数据已与当前主群集 cluster-newyork 上的数据重新同步后,请使用此过程在最初的主群集 cluster-paris 上重新启动应用程序。

开始之前

在执行“故障转移-切换”前,在 cluster-newyork 上已进行了接管操作。这些群集现在具有以下角色:

步骤
  1. 将最初的主群集 cluster-paris 与当前的主群集 cluster-newyork 进行重新同步。

    cluster-paris 放弃自己的配置,从本地复制 cluster-newyork 配置。重新同步伙伴关系和保护组配置。

    1. cluster-paris 上,取消激活本地群集上的保护组。


      # geopg stop -e Local protection-group-name
      
      -e Local

      指定命令的范围

      指定 local 范围后,该命令将仅在本地群集上有效。

      protection-group-name

      指定保护组的名称

      如果已取消激活该保护组,则保护组中资源组的状态可能为 Error。状态为 Error,原因是应用程序资源组处于被管理和脱机状态。

      取消激活保护组将导致应用程序资源组不再受到管理,并且清除 Error 状态。

    2. cluster-paris 上重新同步伙伴关系。


      # geops update partnership-name
      
      partnership-name

      指定伙伴关系的名称。


      注 –

      即使您在为多个保护组执行“故障恢复-切换”操作,您也仅需要执行一次此步骤。


      有关同步伙伴关系的更多信息,请参见重新同步伙伴关系

    3. cluster-paris 上重新同步每个保护组。

      由于在 cluster-newyork 上保护组的角色为 primary,因此此步骤可确保在 cluster-paris 上保护组的角色为 secondary


      # geopg update protection-group-name 
      
      protection-group-name

      指定保护组的名称

      有关同步保护组的更多信息,请参见重新同步 Sun StorEdge Availability Suite 3.2.1 保护组

  2. cluster-paris 上,验证每个保护组的群集配置。


    # geopg validate protection-group-name
    
    protection-group-name

    指定标识单个保护组的唯一名称

    有关更多信息,请参见如何验证 Sun StorEdge Availability Suite 3.2.1 保护组

  3. cluster-paris 上激活每个保护组。

    在激活保护组时,它的应用程序资源组也会进入联机状态。


    # geopg start -e Global protection-group-name
    
    -e Global

    指定命令的范围

    通过指定 Global 范围,该命令在部署了保护组的两个群集上生效。

    protection-group-name

    指定保护组的名称


    注 –

    进行“故障转移-切换”操作时,请勿使用 -n 选项,原因是需要从当前的主群集 cluster-newyork 到当前的辅助群集 cluster-paris 对数据进行同步。


    由于保护组具有辅助角色,因此将从当前主群集 cluster-newyork 到当前辅助群集 cluster-paris 对数据进行同步。

    有关 geopg start 命令的更多信息,请参见如何激活 Sun StorEdge Availability Suite 3.2.1 保护组

  4. 确认数据已完全同步。

    首先,确认在 cluster-newyork 上保护组的状态为正常


    phys-newyork-1# geoadm status

    参阅输出的 Protection Group 部分。

    下一步,确认复制资源组 AVS-protection-group-name-rep-rg 中的所有资源均报告 OK 状态。


    phys-newyork-1# scstat -g
  5. 在任一个群集上,为每个保护组从 cluster-newyorkcluster-paris 执行切换操作。


    # geopg  switchover [-f] -m cluster-paris protection-group-name
    

    有关更多信息,请参见如何将 Sun StorEdge Availability Suite 3.2.1 保护组从主群集切换到辅助群集

    cluster-paris 承担其作为保护组主群集的最初角色。

  6. 在每个群集上使用 geoadm status 命令验证复制资源和应用程序资源组与资源是否处于联机状态,以确保切换操作成功执行。

    另外,必须验证目前保护组是否在 cluster-paris 上为“主”、在 cluster-newyork 上为“辅助”,而且两个群集的“数据复制”和“资源组”状态是否均显示为 OK


    # geoadm status

Procedure如何在使用 Sun StorEdge Availability Suite 3.2.1 复制的系统上执行“故障恢复-接管”操作

使用此过程在最初的主群集 cluster-paris 上重新启动应用程序,然后在最初的主群集上使用当前数据。在辅助群集 cluster-newyork 作为主群集时,其上的所有更新都将被放弃。


注 –

此外,您还可以在最初的主群集 cluster-paris 上继续使用数据。在 cluster-newyork 上执行接管操作后,肯定没有从新的主群集 cluster-newyork 向最初的主群集 cluster-paris 复制数据。


开始之前

执行“故障转移-接管”操作前,群集具有以下角色:

步骤
  1. 将最初的主群集 cluster-paris 与最初的辅助群集 cluster-newyork 进行重新同步。

    cluster-paris 将放弃自己的配置,并在本地复制 cluster-newyork 的配置。

    1. cluster-paris 上重新同步伙伴关系。


      # geops update partnership-name
      
      partnership-name

      指定伙伴关系的名称。


      注 –

      即使您在为多个保护组执行“故障恢复-接管”操作,您也仅需要执行一次此步骤。


      有关同步伙伴关系的更多信息,请参见重新同步伙伴关系

    2. cluster-paris 上重新同步每个保护组。

      如果已激活保护组,请使用 geopg stop 命令取消激活该保护组。有关取消激活保护组的更多信息,请参见如何取消激活 Sun StorEdge Availability Suite 3.2.1 保护组


      # geopg update protection-group-name
      
      protection-group-name

      指定保护组的名称

      有关同步保护组的更多信息,请参见如何重新同步 Sun StorEdge Availability Suite 3.2.1 保护组

  2. cluster-paris 上,验证每个保护组的群集配置。


    # geopg validate protection-group-name
    
    protection-group-name

    指定标识单个保护组的唯一名称

    有关更多信息,请参见如何验证 Sun StorEdge Availability Suite 3.2.1 保护组

  3. cluster-paris 上,在没有进行数据复制的情况下激活辅助角色中的每个保护组。

    由于 cluster-paris 上的保护组具有 secondary 角色,因此 geopg start 命令不会重新启动 cluster-paris 上的应用程序。


    # geopg start -e local -n protection-group-name
    
    -e local

    指定命令的范围

    指定 local 范围后,该命令将仅在本地群集上有效。

    -n

    防止在启动保护组时启动数据复制


    注 –

    您必须使用 -n 选项。


    protection-group-name

    指定保护组的名称

    有关更多信息,请参见如何激活 Sun StorEdge Availability Suite 3.2.1 保护组

    系统不会启动从 cluster-newyorkcluster-paris 的复制,因为在 cluster-paris 上已指定 -n 选项。

  4. cluster-paris 上,为每个保护组执行接管操作。


    # geopg takeover  [-f] protection-group-name
    
    -f

    在不经您确认的情况下强制该命令执行操作

    protection-group-name

    指定保护组的名称

    有关 geopg takeover 命令的更多信息,请参见如何强制辅助群集对 Sun StorEdge Availability Suite 3.2.1 服务立即执行接管操作

    cluster-paris 上的保护组现在具有 primary 角色,而 cluster-newyork 上的保护组则具有 secondary 角色。

  5. cluster-paris 上激活每个保护组。

    由于 cluster-newyork 上的保护组具有 secondary 角色,因此 geopg start 命令不会重新启动 cluster-newyork 上的应用程序。


    # geopg start -e local [-n] protection-group-name
    
    -e local

    指定命令的范围

    指定 local 范围后,该命令将仅在本地群集上有效。

    -n

    防止在启动保护组时启动数据复制

    如果省略此选项,则在启动保护组时会启动数据复制子系统。

    protection-group-name

    指定保护组的名称

    有关 geopg start 命令的更多信息,请参见如何激活 Sun StorEdge Availability Suite 3.2.1 保护组

  6. 启动数据复制。

    要启动数据复制,请激活主群集 cluster-paris 上的保护组。


    # geopg start -e local protection-group-name
    

    有关 geopg start 命令的更多信息,请参见如何激活 Sun StorEdge Availability Suite 3.2.1 保护组