Sun Cluster Geographic Edition 数据复制指南(适用于 Hitachi TrueCopy)

从 Hitachi TrueCopy 数据复制错误中恢复

在数据复制级别发生错误时,该错误反映在相关设备组的复制资源组中资源的状态中。

本节提供了以下信息:

如何检测数据复制错误

有关不同的 Resource status 值如何映射到实际的复制对状态的信息,请参见表 2–6

您可以使用 clresource 命令检查复制资源的状态,如下所示:


phys-paris-1# clresource status -v

运行 clresource status 命令可能会返回以下内容:


=== Cluster Resources ===

Resource Name          de Name        State      Status Message
-------------            ---------    -----      --------------
r-tc-tcpg1-devgroup1   phys-paris-2   Offline    Offline
                       phys-paris-1   Online     Faulted - P-VOL:PSUE

hasp4nfs               phys-paris-2   Offline    Offline
                       phys-paris-1   Offline    Offline

使用 geoadm status 命令可显示保护组中所有设备组的聚合资源状态。例如,上述示例中 clresource status 命令的输出表明 Hitachi TrueCopy 设备组 devgroup1cluster-paris 上处于 PSUE 状态。表 2–6 表明 PSUE 状态对应于资源状态 FAULTED。因此,保护组的数据复制状态也是 FAULTED。此状态反映在 geoadm status 命令的输出中,该命令会将保护组的状态显示为 Error


phys-paris-1# geoadm status
Cluster: cluster-paris

Partnership "paris-newyork-ps"  : OK
   Partner clusters             : cluster-newyork
   Synchronization              : OK      
   ICRM Connection              : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK 
      Heartbeat plug-in "ping_plugin"             : Inactive
      Heartbeat plug-in "tcp_udp_plugin"          : OK

Protection group "tcpg"   : Error
      Partnership         : paris-newyork-ps
      Synchronization     : OK

      Cluster cluster-paris    : Error
         Role                  : Primary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK 
   
      Cluster cluster-newyork  : Error
         Role                  : Secondary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

Pending Operations
      Protection Group         : "tcpg"
      Operations               : start

Procedure如何从 Hitachi TrueCopy 数据复制错误中恢复

要从错误状态中恢复,您可能需要执行以下过程中的部分或全部步骤。

  1. 使用 Hitachi TrueCopy 文档中的过程来确定导致 FAULTED 状态的原因。此状态显示为 PSUE

  2. 使用 Hitachi TrueCopy 过程从故障状态中恢复。

    如果恢复过程更改了设备组状态,则资源将自动检测此状态并将其作为新的保护组状态来报告。

  3. 重新验证保护组的配置


    phys-paris-1# geopg validate protectiongroupname 
    
    protectiongroupname

    指定 Hitachi TrueCopy 保护组的名称

  4. 查看保护组配置的状态。


    phys-paris-1# geopg list protectiongroupname 
    
    protectiongroupname

    指定 Hitachi TrueCopy 保护组的名称

  5. 查看该保护组的运行时状态。


    phys-paris-1# geoadm status