Sun Cluster Geographic Edition 系统管理指南

第 1 章 Sun Cluster Geographic Edition 软件管理介绍

Sun Cluster Geographic Edition 软件借助地理上相互分开的多个群集来保护应用程序免受意外破坏。这些群集包含了完全一样的 Sun Cluster Geographic Edition 基础结构副本,这些副本负责在群集之间管理复制数据。Sun Cluster Geographic Edition 软件是 Sun Cluster 软件的分层扩展。

本章包含以下主题:

Sun Cluster Geographic Edition 管理任务

开始管理任务之前,请先熟悉《Sun Cluster Geographic Edition 安装指南》《Sun Cluster Geographic Edition 概述》中的规划信息。本指南包含了用于管理和维护 Sun Cluster Geographic Edition 配置的标准任务。

有关 Sun Cluster、数据服务以及硬件管理的常规任务,请参考 Sun Cluster 文档。

您可以在运行 Sun Cluster Geographic Edition 软件的群集上执行所有的管理任务,而不会导致任何节点或群集发生故障。对于可用的群集,您可以安装、配置、启动、使用、停止和卸载 Sun Cluster Geographic Edition 软件。


注 –

执行预备操作(比如安装数据复制软件和执行 Sun Cluster 管理任务)时,可能需要使节点或群集进入脱机状态。有关管理限制的信息,请参考相应的产品文档。


Sun Cluster Geographic Edition 管理工具

您可以使用图形用户界面 (GUI) 或命令行界面 (CLI) 在运行 Sun Cluster Geographic Edition 软件的群集上执行管理任务。

本指南介绍了使用 CLI 执行管理任务的过程。

图形用户界面

Sun Cluster 软件支持 SunPlexTM Manager。后者是一种可用于在群集上执行各种管理任务的 GUI 工具。有关如何使用 SunPlex Manager 的特定信息,请参见 Sun Cluster 联机帮助。


注 –

要使用 GUI 管理 Sun Cluster Geographic Edition 软件,伙伴关系双方群集上所有节点的超级用户密码必须相同。


在使用 geoadm start 命令启用了 Sun Cluster Geographic Edition 软件的基础结构之后,您只能使用 GUI 对该软件进行管理。使用 CLI 可发出 geoadm startgeoadm stop 命令。有关启用和禁用 Sun Cluster Geographic Edition 基础结构的信息,请参见第 3 章,管理 Sun Cluster Geographic Edition 基础结构

GUI 不支持在伙伴关系之外创建自定义心跳。如果您希望在伙伴关系加入操作中指定自定义心跳,请使用 CLI 执行 geops join-partnership 命令。

命令行界面

表 1–1 列出了可用于管理 Sun Cluster Geographic Edition 软件的命令。有关各种命令的更多信息,请参阅《Sun Cluster Geographic Edition 参考手册》

表 1–1 Sun Cluster Geographic Edition CLI

命令 

描述 

geoadm

在本地群集上启用或禁用 Sun Cluster Geographic Edition 软件,并打印本地群集的运行时状态 

geohb

配置和管理随 Sun Cluster Geographic Edition 软件一起提供的心跳机制 

geops

创建和管理群集之间的伙伴关系 

geopg

配置和管理保护组 

灾难恢复管理概述

本节提供了一个灾难恢复示例以及管理员可能需要执行的操作。

公司 X 有两个在地理上处于不同位置的群集:cluster-paris 在巴黎,cluster-newyork 在纽约。这些群集已配置为伙伴群集。在巴黎的群集被配置为主群集,在纽约的群集被配置为辅助群集。

在发生风暴时出现了电源故障,这导致 cluster-paris 群集暂时出现故障。对于管理员来说,将会发生以下事件:

  1. cluster-pariscluster-newyork 之间的心跳通信丢失。由于在创建伙伴关系时配置了心跳通知,因此系统会向管理员发送心跳丢失通知电子邮件。

    有关配置伙伴关系和心跳通知的信息,请参见创建和修改伙伴关系

  2. 管理员接收通知电子邮件,然后按照公司流程验证是否需要由辅助群集进行接管操作以便解决连接断开问题。由于接管操作的代价很高,因此除非在两个小时内无法修复主群集,否则公司 X 不允许采用接管操作。

    有关验证使用 Sun StorEdge Availability Suite 3.2.1 的系统是否断开连接的信息,请参见检测使用 Sun StorEdge Availability Suite 3.2.1 数据复制的系统上的群集故障

    有关验证使用 Hitachi TrueCopy 的系统是否断开连接的信息,请参见检测使用 Hitachi TrueCopy 数据复制的系统上的群集故障

  3. 由于至少在一天内无法使 cluster-paris 群集再次联机,因此管理员将在纽约的节点上执行 geopg takeover 命令,这会启动在纽约的辅助群集 cluster-newyork 上的保护组。

    有关在使用 Sun StorEdge Availability Suite 3.2.1 数据复制的系统上执行接管操作的信息,请参见在使用 Sun StorEdge Availability Suite 3.2.1 的系统上强制执行接管操作。有关在使用 Hitachi TrueCopy 数据复制的系统上执行接管操作的信息,请参见在使用 Hitachi TrueCopy 数据复制的系统上强制执行接管操作

  4. 执行接管操作之后, 辅助群集 cluster-newyork 将成为新的主群集。由于巴黎的故障群集仍被配置为主群集,因此当 cluster-paris 重新启动时,群集会检测到自己已关闭并失去了与伙伴群集的联系。然后,cluster-paris 进入错误状态,需要执行管理操作进行修复。该群集可能还需要恢复和重新同步数据。

    有关在使用 Sun StorEdge Availability Suite 3.2.1 数据复制的系统上进行接管操作后恢复数据的信息,请参见在执行接管操作后恢复 Sun StorEdge Availability Suite 3.2.1 数据。有关在使用 Hitachi TrueCopy 数据复制的系统上执行接管操作的信息,请参见在使用 Hitachi TrueCopy 复制的系统上将服务故障恢复到最初的主群集