Sun Cluster Geographic Edition 系统管理指南

从 Hitachi TrueCopy 数据复制错误中恢复

在数据复制级别发生错误时,该错误反映在相关设备组的复制资源组中资源的状态中。

如何检测数据复制错误

在数据复制级别发生错误时,该错误反映在相关设备组的复制资源组中资源的状态中。

有关不同的 Resource status 值如何映射到实际的复制配对状态的信息,请参见表 10–6

使用 scstat -g 命令可以查看复制资源的状态,如下所示:


phys-paris-1# scstat -g

运行 scstat -g 命令可能会返回以下内容:


...

--Resources --
            Resource Name       Node Name           State         Status Message
            -------------       ---------           -----         --------------
Resource: r-tc-tcpg1-devgroup1  phys-paris-2        Offline       Offline
Resource: r-tc-tcpg1-devgroup1  phys-paris-1        Online        Faulted - P-VOL:PSUE

Resource: hasp4nfs              phys-paris-1        Offline       Offline
Resource: hasp4nfs              phys-paris-2        Offline       Offline

...

使用 geoadm status 命令可以显示保护组中的所有设备组的聚集资源状态。例如,前面示例中的 scstat -g 命令的输出表明 Hitachi TrueCopy 设备组 devgroup1cluster-paris 上处于 PSUE 状态。表 10–6 显示 PSUE 状态对应于资源状态 FAULTED。因此,保护组的数据复制状态也是 FAULTED。此状态反映在 geoadm status 命令的输出中,该命令显示保护组的状态为 Error


phys-paris-1# geoadm status
Cluster: cluster-paris

Partnership "paris-newyork-ps"  : OK
   Partner clusters             : cluster-newyork
   Synchronization              : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK
      Heartbeat plug-in "ping_plugin"             : Inactive
      Heartbeat plug-in "icrm_plugin"             : OK
      Heartbeat plug-in "tcp_udp_plugin"          : OK

Protection group "tcpg"   : Error
      Partnership         : paris-newyork-ps
      Synchronization     : OK

      Cluster cluster-paris    : Error
         Role                  : Primary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

      Cluster cluster-newyork  : Error
         Role                  : Secondary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

Pending Operations
      Protection Group         : "tcpg"
      Operations               : start        

Procedure如何从 Hitachi TrueCopy 数据复制错误中恢复

要从错误状态中恢复,您可能需要执行以下过程中的部分或全部步骤。

步骤
  1. 使用 Hitachi TrueCopy 文档中的过程来确定导致 FAULTED 状态的原因。此状态显示为 PSUE

  2. 使用 Hitachi TrueCopy 过程从故障状态中恢复。

    如果恢复过程更改了设备组状态,则资源将自动检测此状态并将其作为新的保护组状态报告。

  3. 重新验证保护组的配置


    phys-paris-1# geopg validate protection-group-name 
    
    protection-group-name

    指定 Hitachi TrueCopy 保护组的名称

  4. 查看保护组配置的状态。


    phys-paris-1# geopg list protection-group-name 
    
    protection-group-name

    指定 Hitachi TrueCopy 保护组的名称

  5. 查看该保护组的运行时状态。


    phys-paris-1# geoadm status