Sun Cluster Geographic Edition 数据复制指南(适用于 EMC Symmetrix Remote Data Facility)

从 EMC Symmetrix Remote Data Facility 数据复制错误中恢复

在数据复制级别发生错误时,该错误反映在相关设备组的复制资源组中资源的状态中。对该保护组执行 geoadm status 命令后,更改后的状态将显示在“数据复制”状态字段中。

如何检测数据复制错误

使用 scstat -g 命令可以查看复制资源的状态,如下所示:


phys-paris-1# scstat -g

有关不同的 Resource status 值如何映射到实际的复制对状态的信息,请参见表 2–4

运行 scstat -g 命令可能会返回以下内容:


...

-- Resources --

            Resource Name       Node Name           State     Status Message
            -------------       ---------           -----     --------------
  Resource: sc_geo_dr-SRDF-srdfpg-devgroup1 pemc1  Online    Online - Partitioned
  Resource: sc_geo_dr-SRDF-srdfpg-devgroup1 pemc2  Offline   Offline
...

使用 geoadm status 命令可查看保护组中所有设备组的聚集资源状态。例如,上述示例中 scstat -g 命令的输出表明 EMC Symmetrix Remote Data Facility 设备组 devgroup1cluster-paris 上处于 Suspended 状态。表 2–4 表明 Suspended 状态对应于资源状态 FAULTED。因此,保护组的数据复制状态也是 FAULTED。此状态反映在 geoadm status 命令的输出中,该命令会将保护组的状态显示为 Error


phys-paris-1# geoadm status
Cluster: cluster-paris

Partnership "paris-newyork-ps"  : OK
   Partner clusters             : cluster-newyork
   Synchronization              : OK      
   ICRM Connection              : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK 
      Heartbeat plug-in "ping_plugin"             : Inactive
      Heartbeat plug-in "tcp_udp_plugin"          : OK

Protection group "srdfpg"   : Error
      Partnership         : paris-newyork-ps
      Synchronization     : OK

      Cluster cluster-paris    : Error
         Role                  : Primary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK 
   
      Cluster cluster-newyork  : Error
         Role                  : Secondary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

Pending Operations
      Protection Group         : "srdfpg"
      Operations               : start        

Procedure如何从 EMC Symmetrix Remote Data Facility 数据复制错误中恢复

要从错误状态中恢复,您可能需要执行以下过程中的部分或全部步骤。

  1. 使用 EMC Symmetrix Remote Data Facility 文档中的相应过程来确定导致 FAULTED 状态的原因。此状态显示为 PSUE

  2. 通过相应的 EMC Symmetrix Remote Data Facility 过程从故障状态中恢复。

    如果恢复过程更改了设备组状态,则资源将自动检测此状态并将其作为新的保护组状态来报告。

  3. 重新验证保护组的配置


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    指定 EMC Symmetrix Remote Data Facility 保护组的名称

    如果 geopg validate 命令确定该配置有效,保护组的状态将会改变以反映实际情况。如果配置无效,geopg validate 会返回一条故障消息。

  4. 查看保护组配置的状态。


    phys-paris-1# geopg list protectiongroupname 
    
    protectiongroupname

    指定 EMC Symmetrix Remote Data Facility 保护组的名称

  5. 查看该保护组的运行时状态。


    phys-paris-1# geoadm status