Sun Cluster Geographic Edition 系统管理指南

第 8 章 监视和验证 Sun Cluster Geographic Edition 软件

本章介绍了可用于监视和验证 Sun Cluster Geographic Edition 软件的文件与工具。

本章包含以下几节:

监视 Sun Cluster Geographic Edition 软件的运行时状态

您可以使用 geoadm status 命令来显示本地启用了 Sun Cluster Geographic Edition 的群集的运行时状态。运行此命令时,显示的输出将由以下几部分构成:

为运行 geoadm status 命令,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见Sun Cluster Geographic Edition 软件和 RBAC

例如,如果管理员在 cluster-paris 群集上运行 geoadm status 命令,将显示如下信息:


phys-paris-1# geoadm status

Cluster: cluster-paris

Partnership "paris-newyork-ps": OK
   Partner clusters    : cluster-newyork
   Synchronization     : OK
   ICRM Connection     : OK

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK        
      Heartbeat plug-in "ping_plugin"    : Inactive
      Heartbeat plug-in "tcp_udp_plugin" : OK

Protection group "tcpg"     : OK
   Partnership              : "paris-newyork-ps"
   Synchronization          : OK

   Cluster cluster-paris    : OK
   Role                     : Primary
   PG activation state      : Activated
   Configuration            : OK
   Data replication         : OK
   Resource groups          : OK

  Cluster cluster-newyork   : OK
     Role                   : Secondary
     PG activation state    : Activated
     Configuration          : OK
     Data replication       : OK
     Resource groups        : OK

Pending Operations
Protection Group     : "tcpg" 
Operation            : start
        

上面显示的信息表明,保护组 tcpg 在主群集 cluster-paris 和辅助群集 cluster-newyork 上均处于激活状态。系统正在伙伴群集之间复制数据,并且两个伙伴群集均已同步。

下表描述了每种状态值的含义。

表 8–1 状态值描述

字段 

值描述 

Partnership

OK – 已连接伙伴群集。

Error – 伙伴群集之间的连接丢失。

Degraded – 已成功创建伙伴关系,但尚未建立与伙伴群集的连接。如果创建了伙伴关系但尚未配置伙伴群集,则会出现此状态值。

Synchronization

OK – 已在伙伴群集之间同步了配置信息。

Error – 伙伴群集之间的配置信息不同。对于伙伴关系同步错误,需要重新同步伙伴关系;对于保护组同步错误,需要重新同步保护组。

有关重新同步伙伴关系的信息,请参见重新同步伙伴关系

有关重新同步保护组的信息,请参见以下数据复制指南之一: 

Mismatch – 配置信息是在不同群集上各自单独创建的。必须使用伙伴群集配置信息的副本替换该配置信息。您可以使用 geopg get 命令同步保护组的配置。

Unknown – 由于伙伴关系双方已断开连接,或者无法访问保护组的某些组件,因此无法获取信息。

ICRM Connection

OK – Intercluster Resource Management (ICRM) 模块正在正常运行。

Error – 本地群集上的 ICRM 模块无法与远程群集上的 ICRM 模块进行通信。

Heartbeat

OK – 心跳检查正在运行,且伙伴群集在指定超时和重试限期内作出响应。

Offline – 心跳检查未在运行。

Error – 心跳检查正在运行,但伙伴群集未作出响应,且重试已超时。

Degraded – 心跳检查正在运行,但其中一个主插件被降级或未在运行。

Heartbeat plug-in

OK – 正在接收来自伙伴群集的响应。

Inactive – 插件未在使用中,但处于待机状态。一旦其他插件未能获得响应,该插件即用于重新联络伙伴群集。

No-Response – 伙伴群集不响应。

Protection group

(保护组的整体状态) 

OK – 同步状态为 OK,每个群集上的保护组状态也为 OK

Degraded – 同步状态为 OK。伙伴关系一方或双方群集上的保护组状态为 Degraded

Unknown – 无法获知同步状态或一方或双方群集上的保护组状态。保护组可以处于联机或脱机状态。

Error – 同步状态或者一方或双方群集上的保护组状态为 Error。保护组可以处于联机或脱机状态。

Protection group > Cluster

(每个群集上保护组的状态) 

OK – 群集上所有保护组组件(如配置数据、数据复制或资源组)的状态为 OKNONEN/A

Degraded – 群集上一个或多个保护组组件的状态为 Degraded

Unknown – 无法获知某些保护组组件(如配置数据、数据复制或资源组)的状态。

Error – 某些保护组组件(如配置数据、数据复制或资源组)的状态为 Error

Protection group > Cluster > Role

Primary – 该群集是此保护组的 Primary 群集。

Secondary – 该群集是此保护组的 Secondary 群集。

Unknown – 由于伙伴关系双方已断开连接,或者无法访问保护组的某些组件,因此无法获取信息。

Protection group > Cluster > PG activation state

Activated – 已激活保护组。

Deactivated – 已取消激活保护组。

Unknown – 由于伙伴关系双方已断开连接,或者无法访问保护组的某些组件,因此无法获取信息。

Protection group > Cluster > Configuration

OK – 已在群集上成功验证保护组的配置。

Error – 在群集上验证保护组配置时发生错误。您需要重新验证保护组。有关验证保护组的信息,请参见以下数据复制指南之一:

Unknown – 由于伙伴关系双方已断开连接,或者无法访问保护组的某些组件,因此无法获取信息。

Protection group > Cluster > Data replication

None – 未配置数据复制。

OK – 激活保护组后,数据复制正在运行,且数据依据伙伴群集进行同步。取消激活保护组会暂停复制操作。该状态仅代表此群集上数据复制的情况,并不反映整体的数据复制状态。此状态映射自数据复制子系统中的相应状态。

Degraded – 激活保护组后,数据并未进行复制,也未依据伙伴群集进行同步。会成功写入新数据,但不会复制新数据。该状态仅代表此群集上数据复制的情况,并不反映整体的数据复制状态。此状态映射自数据复制子系统中的相应状态。

Error – 如果数据复制子系统报告错误,或取消激活保护组后数据复制未暂停,则从主群集到辅助群集的数据复制呈错误状态。该状态仅代表此群集上数据复制的情况,并不反映整体的数据复制状态。此状态映射自数据复制子系统中的相应状态。

Unknown – 由于伙伴关系双方已断开连接,或者无法访问保护组的某些组件,因此无法获取信息。

N/A – 无法映射保护组的数据复制状态。数据复制本身处于有效状态,但对于保护组来说处于 Error 状态。只有在使用 Sun StorEdge Availability Suite 3.2.1 数据复制时才会出现这种状态。

Protection group > Cluster > Resource groups

None – 没有任何资源组受此保护组的保护。

OK – 如果群集具 Primary 角色,所有资源组在系统激活保护组后处于联机状态,或在系统取消激活保护组后处于不受管理状态。如果群集具有 Secondary 角色,则所有资源组均不受管理。

Error – 如果群集具 Primary 角色,不是所有资源组都在系统激活保护组后处于联机状态,也不是所有资源组都在系统取消激活保护组后处于不受管理状态。如果群集具有 Secondary 角色,则并非所有资源组都处于不受管理状态。

Unknown – 由于伙伴关系双方已断开连接,或者无法访问保护组的某些组件,因此无法获取信息。

有关检查复制运行时状态的更多具体信息,请参见以下数据复制指南之一:

查看 Sun Cluster Geographic Edition 日志消息

所有 Sun Cluster Geographic Edition 组件生成的日志消息都存储在日志文件中。

有关在通用代理容器中加载、运行和停止 Sun Cluster Geographic Edition 组件的信息均记录在以下日志文件中。最新消息依次记录在文件 0、1、2 中。

系统日志消息存储在 /var/adm/messages 目录下的日志文件中。

每个群集节点上都保存着以前日志文件的单独副本。所有群集节点上的日志文件组合在一起就形成了当前登录信息的完整快照。Sun Cluster Geographic Edition 模块的日志消息会在 Sun Cluster Geographic Edition 软件当前处于活动状态的那个节点上进行更新。在数据复制资源当前处于 Online 状态的节点上,数据复制控制日志消息会被更新。

显示伙伴关系和保护组的配置信息

您可以显示本地群集的当前伙伴关系配置,包括在本地群集与远程群集之间定义的所有伙伴关系的列表。

您也可以显示群集上定义的特定保护组或所有保护组的当前配置。

Procedure如何显示伙伴关系的配置信息

  1. 登录到一个群集节点。

    要完成此过程,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见Sun Cluster Geographic Edition 软件和 RBAC

  2. 显示有关伙伴关系的信息。


    # geops list partnershipname
    
    partnershipname

    指定伙伴关系的名称。如果不指定伙伴关系,geops list 命令将显示所有伙伴关系的信息。

    有关 Sun Cluster Geographic Edition 软件支持的名称和值的信息,请参见附录 B,Sun Cluster Geographic Edition 实体合法的名称和值


示例 8–1 显示伙伴关系配置信息

本示例显示了本地 cluster-paris 和远程 cluster-newyork 之间的伙伴关系配置信息。


# geops list paris-newyork-ps

Procedure如何显示保护组的配置信息

  1. 登录到一个群集节点。

    要完成此过程,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见Sun Cluster Geographic Edition 软件和 RBAC

  2. 显示保护组的相关信息。


    # geopg list [protectiongroupname]
    protectiongroupname

    指定保护组的名称。

    如果不指定保护组,该命令将列出您系统上配置的所有保护组的相关信息。


示例 8–2 显示保护组的配置信息

本示例显示了 cluster-paris 上配置的 avspg 的配置信息。


# geopg list avspg