Sun Cluster Geographic Edition 数据复制指南(适用于 Oracle Data Guard)

Procedure如何在使用 Oracle Data Guard 复制的系统上执行故障恢复接管操作

执行本过程可在原来的主群集 cluster-paris 上重新启动应用程序,并使用该群集上的当前数据。


注 –

备用群集 cluster-newyork 充当主群集时在它上面进行的任何更新都将被放弃。


故障恢复过程仅适用于处在伙伴关系中的群集。对于每个伙伴关系而言,以下过程只需执行一次。


注 –

在有些情况下,您可以继续使用原来的主群集 cluster-paris 上的数据。但是,在 cluster-newyork 上执行接管操作后,便不能再将新主群集 cluster-newyork 中的数据复制到原来的主群集 cluster-paris


开始之前

在开始故障恢复接管过程之前,群集必须具有下列角色:

  1. 如果原始主群集 cluster-paris 发生故障,请确认是否已重新启动群集以及是否在群集上启用了 Sun Cluster Geographic Edition 基础结构。

    有关重新启动群集的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“引导群集”

  2. 将新的 Oracle Data Guard 主数据库作为原始主数据库的备用数据库恢复到原始主数据库发生故障前那一刻。

    请参阅介绍如何执行此步骤的 Oracle 文档


    注 –

    您可能需要使用 dgmgrl 命令删除并重新创建 Oracle Data Guard Broker 配置。


  3. 确定原始主群集 cluster-paris 作为 Oracle Data Guard 配置的一部分重新以主群集身份正确运行。


    oracle (phys-paris-1)$ dgmgrl sys/sysdba_password@sales-svc
    DGMGRL> show configuration;
    

    如果原始主群集 cluster-paris 正确运行,show configuration 命令会显示 SUCCESS 状态。

    如果原始主群集在故障点启动,它会标记为取消激活的辅助群集。此外,原始备用群集会标记为激活的主群集。

    如果原始主群集在故障点关闭,它会标记为取消激活的主群集。此外,原始备用群集会标记为激活的主群集。

  4. 原始主群集 cluster-paris 是否在故障点启动或关闭?

    • 如果原始主群集 cluster-paris 在故障点关闭,请将原始备用群集 &seconda y_cluster; 更新至辅助群集。

      1. 在原始备用群集(即已成为新的主群集的群集)上停止保护组。


        phys-newyork-1# geopg stop -e local protectiongroupname
        
      2. 在原始备用群集(即已成为新的主群集的群集)上更新保护组。


        phys-newyork-1# geopg update protectiongroupname
        

        现在,这些角色都是正确的,但两个群集均标记为取消激活。

        有关同步保护组的更多信息,请参见如何重新同步 Oracle Data Guard 保护组

      3. cluster-pariscluster-newyork 上,本地验证每个保护组的配置。

        请确保保护组不处于 Error 状态。当保护组处于 Error 状态时,无法启动该保护组。


        phys-paris-1# geopg validate protectiongroupname
        phys-newyork-1# geopg validate protectiongroupname
        

        有关更多信息,请参见如何验证 Oracle Data Guard 保护组

      4. 从其中一个群集中的任一节点,在两个群集上以全局方式激活保护组。


        # geopg start -e global protectiongroupname
        

        在两个群集上激活保护组后,即成功执行了故障恢复接管。

    • 如果原始主群集 cluster-paris 在故障点启动,请确定辅助群集(即原始主群集)配置的状态。


      phys-newyork-1# geoadm status
      
      • 如果 Configuration 的状态设置为 OK,请对配置执行同步操作。

        1. 对原始主群集 cluster-paris 上的每个保护组启动接管。


          phys-paris-1# geopg takeover [-f] protectiongroupname
          
        2. 如果原始备用群集 cluster-newyork 的配置标记为 Error,请验证每个保护组的配置。


          cluster-newyork# geopg validate protectiongroupname
          

          有关更多信息,请参见如何验证 Oracle Data Guard 保护组

        3. 在两个群集上以全局方式激活保护组。


          cluster-newyork# geopg start -e global protectiongroupname
          

          在两个群集上激活保护组后,即成功执行了故障恢复接管。

      • 如果 Configuration 的状态设置为 Error,请解决此问题。

        1. 取消激活处于 Error 状态的辅助配置(即原始主配置)。


          phys-newyork-1#  geopg stop -e local protectiongroupname
          
        2. 强制执行接管使辅助配置再次成为主配置,并与基础 Oracle dgmgrl 配置相匹配。


          phys-newyork-1# geopg takeover -f protectiongroupname
          
        3. cluster-pariscluster-newyork 群集上,本地验证每个保护组的配置。


          phys-paris-1# geopg validate protectiongroupname
          phys-newyork-1# geopg validate protectiongroupname
          

          有关更多信息,请参见如何验证 Oracle Data Guard 保护组

        4. 从其中一个群集的任一节点,在两个群集上以全局方式激活保护组。


          # geopg start -e global protectiongroupname
          

          在两个群集上激活保护组后,即成功执行了故障恢复接管。