Sun Cluster Geographic Edition 系统管理指南

第 13 章 监视和验证 Sun Cluster Geographic Edition 软件

本章介绍了可用于监视和验证 Sun Cluster Geographic Edition 软件的文件与工具。

本章讨论下列主题:

监视 Sun Cluster Geographic Edition 软件的运行时状态

使用 geoadm status 命令,可以打印本地启用了 Sun Cluster Geographic Edition 的群集的运行时状态。运行此命令时,显示的输出将由以下几部分构成:

为运行 geoadm status 命令,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见Sun Cluster Geographic Edition 软件和 RBAC

例如,如果管理员在 cluster-paris 上运行 geoadm status 命令,将会打印出如下信息:


phys-paris-1# geoadm status

Cluster: cluster-paris

Partnership "paris-newyork-ps": OK
   Partner clusters    : cluster-newyork
   Synchronization     : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK        
      Heartbeat plug-in "ping_plugin"    : Inactive
      Heartbeat plug-in "icrm_plugin"    : OK
      Heartbeat plug-in "tcp_udp_plugin" : OK

Protection group "tcpg"     : OK
   Partnership              : "paris-newyork-ps"
   Synchronization          : OK

   Cluster cluster-paris    : OK
   Role                     : Primary
   PG activation state      : Activated
   Configuration            : OK
   Data replication         : OK
   Resource groups          : OK

  Cluster cluster-newyork   : OK
     Role                   : Secondary
     PG activation state    : Activated
     Configuration          : OK
     Data replication       : OK
     Resource groups        : OK

Pending Operations
Protection Group     : "tcpg" 
Operation            : start
        

打印出来的消息显示,主群集 cluster-paris 和辅助群集 cluster-newyork 上都激活了保护组 tcpg。系统正在伙伴群集之间复制数据,并且两个伙伴群集均已同步。

下表描述了每种状态值的含义。

表 13–1 状态值描述

字段 

值描述 

Partnership

OK – 已连接伙伴群集。

Error – 伙伴群集之间的连接丢失。

Degraded – 已成功创建伙伴关系,但尚未建立与伙伴群集的连接。如果创建了伙伴关系但尚未配置伙伴群集,则会出现此状态值。

Synchronization

OK – 已在伙伴群集之间同步了配置信息。

Error – 伙伴群集之间的配置信息不同。对于同步伙伴关系错误,需要重新同步伙伴关系;对于同步保护组错误,需要重新同步保护组。

有关重新同步伙伴关系的信息,请参见重新同步伙伴关系

有关重新同步 Sun StorEdge Availability Suite 3.2.1 保护组的信息,请参见重新同步 Sun StorEdge Availability Suite 3.2.1 保护组

有关重新同步 Hitachi TrueCopy 保护组的信息,请参见重新同步 Hitachi TrueCopy 保护组

Mismatch – 配置信息是在不同群集上各自单独创建的。必须删除某个群集上的配置信息,然后用伙伴群集的配置信息替换。

Unknown – 由于伙伴关系群集之间已断开连接,或者无法访问某些保护组组件,因此无法访问信息。

Heartbeat

OK – 心跳检查正在运行,且伙伴群集在指定超时和重试限期内作出响应。

Offline – 心跳检查未在运行。

Error – 心跳检查正在运行,但伙伴群集未作出响应,且重试已超时。

Degraded – 心跳检查正在运行,但其中一个主插件被降级或未在运行。

Heartbeat plug-in

OK – 正在接收来自伙伴群集的响应。

Inactive – 插件未在使用中,但处于待机状态。一旦其他插件未能获得响应,该插件即用于重新联络伙伴群集。

No-Response – 伙伴群集不响应。

Protection group

(保护组的整体状态) 

OK – 同步状态为 OK,每个群集上的保护组状态为 OK

Degraded – 同步状态为 OK。伙伴关系一方或双方群集上的保护组状态为 Degraded

Unknown – 无法获知同步状态或一方或双方群集上的保护组状态。保护组可以处于联机或脱机状态。

Error – 同步状态或者一方或双方群集上的保护组状态为 Error。保护组可以处于联机或脱机状态。

Protection group > Cluster

(每个群集上保护组的状态) 

OK – 群集上所有保护组组件(如配置数据、数据复制或资源组)的状态为 OKNONEN/A

Degraded – 群集上一个或多个保护组组件的状态为 Degraded

Unknown – 部分保护组组件(如配置数据、数据复制或资源组)的状态无法获知。

Error – 部分保护组组件(如配置数据、数据复制或资源组)的状态为 Error

Protection group > Cluster > Role

Primary – 该群集是此保护组的 Primary 群集。

Secondary – 该群集是此保护组的 Secondary 群集。

Unknown – 由于伙伴关系群集之间已断开连接,或者无法访问某些保护组组件,因此无法访问信息。

Protection group > Cluster > PG activation state

Activated – 已激活保护组。

Deactivated – 已取消激活保护组。

Unknown – 由于伙伴关系群集之间已断开连接,或者无法访问某些保护组组件,因此无法访问信息。

Protection group > Cluster > Configuration

OK – 已在群集上成功验证保护组的配置。

Error – 在群集上验证保护组配置时发生错误。您需要重新验证保护组。有关验证 Sun StorEdge Availability Suite 3.2.1 保护组的信息,请参见如何验证 Sun StorEdge Availability Suite 3.2.1 保护组。有关验证 Hitachi TrueCopy 保护组的信息,请参见如何验证 Hitachi TrueCopy 保护组

Unknown – 由于伙伴关系群集之间已断开连接,或者无法访问某些保护组组件,因此无法访问信息。

Protection group > Cluster > Data replication

None – 未配置数据复制。

OK – 激活保护组后,数据复制正在运行,且数据依据伙伴群集进行同步。取消激活保护组会暂停复制操作。该状态仅代表此群集上数据复制的情况,并不反映整体的数据复制状态。此状态映射自数据复制子系统中的相应状态。

Degraded – 激活保护组后,数据并未进行复制,也未依据伙伴群集进行同步。会成功写入新数据,但不会复制新数据。该状态仅代表此群集上数据复制的情况,并不反映整体的数据复制状态。此状态映射自数据复制子系统中的相应状态。

Error – 如果数据复制子系统报告错误,或取消激活保护组后数据复制未暂停,则从主群集到辅助群集的数据复制呈错误状态。该状态仅代表此群集上数据复制的情况,并不反映整体的数据复制状态。此状态映射自数据复制子系统中的相应状态。

Unknown – 由于伙伴关系群集之间已断开连接,或者无法访问某些保护组组件,因此无法访问信息。

N/A – 无法映射保护组的数据复制状态。数据复制本身处于有效状态,但对于保护组来说处于 Error 状态。只有在使用 Sun StorEdge Availability Suite 3.2.1 数据复制时才会出现这种状态。

Protection group > Cluster > Resource groups

None – 该保护组未保护任何资源组。

OK – 如果群集具 Primary 角色,所有资源组在系统激活保护组后处于联机状态,或在系统取消激活保护组后处于不受管理状态。如果群集具 Secondary 角色,所有资源组均不受管理。

Error – 如果群集具 Primary 角色,不是所有资源组都在系统激活保护组后处于联机状态,也不是所有资源组都在系统取消激活保护组后处于不受管理状态。如果群集具 Secondary 角色,不是所有的资源组均处于不受管理状态。

Unknown – 由于伙伴关系群集之间已断开连接,或者无法访问某些保护组组件,因此无法访问信息。

有关检查复制的运行时状态的更多具体信息,请参见检查 Sun StorEdge Availability Suite 3.2.1 数据复制的运行时状态检查 Hitachi TrueCopy 数据复制的运行时状态

查看 Sun Cluster Geographic Edition 日志消息

所有 Sun Cluster Geographic Edition 组件生成的日志消息都存储在日志文件中。

有关在通用代理容器中加载、运行和停止 Sun Cluster Geographic Edition 组件的信息都记录在以下日志文件中。最新消息依次记录在文件 0、1、2 中。

系统日志消息存储在 /var/adm/messages 目录下的日志文件中。

每个群集节点上都保存着以前日志文件的单独副本。所有群集节点上的日志文件组合在一起就形成了当前登录信息的完整快照。当前 Sun Cluster Geographic Edition 软件处于活动状态的节点上的 Sun Cluster Geographic Edition 模块日志消息得以更新。当前数据复制资源处于 Online 状态的节点上的数据复制控制日志消息得以更新。

打印有关伙伴组和保护组的配置信息

您可以打印当前本地群集的伙伴关系配置。您打印的信息包括在本地与远程群集之间定义的所有伙伴关系的列表。

您还可以打印特定保护组或群集上定义的所有保护组的当前配置。

Procedure如何显示伙伴关系的配置信息

步骤
  1. 登录到一个群集节点。

    要完成此过程,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见Sun Cluster Geographic Edition 软件和 RBAC

  2. 显示有关伙伴关系的信息。


    # geops list partnership-name
    
    partnership-name

    指定伙伴关系的名称。如果没有指定伙伴关系,geops list 命令将显示所有伙伴关系的信息。

    有关 Sun Cluster Geographic Edition 软件支持的名称和值的信息,请参见附录 B,Sun Cluster Geographic Edition 实体合法的名称和值


示例 13–1 显示伙伴关系配置信息

本示例显示了本地 cluster-paris 和远程 cluster-newyork 之间的伙伴关系配置信息。


# geops list paris-newyork-ps

Procedure如何显示保护组的配置信息

步骤
  1. 登录到一个群集节点。

    要完成此过程,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见Sun Cluster Geographic Edition 软件和 RBAC

  2. 显示一个或所有保护组的信息。


    # geopg list [protection-group-name]
    protection-group-name

    指定保护组的名称

    如果不指定保护组,则该命令将列出您系统上配置的所有保护组的信息。


示例 13–2 显示保护组的配置信息

本示例显示了 cluster-paris 上配置的 avspg 的配置信息。


# geopg list avspg