本章提供了有关群集管理准备工作方面的信息并讲述了使用 Sun Cluster 管理工具的过程。
以下是本章中包含的过程的列表。
Sun Cluster 的高可用环境可确保最终用户能够使用关键的应用程序。 系统管理员的职责就是保证 Sun Cluster 的稳定性和可操作性。
在执行管理任务前,应首先熟悉《Sun Cluster 3.0 12/01 软件安装指南》中的规划信息和《Sun Cluster 3.0 12/01 概念》文档中的术语汇编。对 Sun Cluster 的管理分为几类任务,分别在以下手册中进行说明。
标准任务,用于定期(例如每天)管理和维护群集。 本指南对这些任务进行了说明。
数据服务任务,比如安装、配置和更改特性。 《Sun Cluster 3.0 12/01 Data Services Installation and Configuration Guide》对这些任务进行了说明。
服务任务,比如添加或检修存储或网络硬件。 《Sun Cluster 3.0 12/01 Hardware Guide》对这些任务进行了说明。
在大多数情况下,可以在群集运行时执行 Sun Cluster 管理任务。这样,对群集的影响就仅限于单个节点。 对于要求关闭整个群集的那些过程,可安排在非工作时间内进行,此时对系统的影响将会最小。 如果您计划关闭群集或某个群集节点,请提前通知用户。
您可以使用图形用户界面 (GUI) 或命令行对 Sun Cluster 执行管理任务。 本节提供了有关这些工具的概述。
您可以用 Sun Cluster 支持的两种图形用户界面 (GUI) 工具对群集执行各种管理任务。 这些 GUI 工具是 SunPlexTM Manager 和 Sun Management Center。 有关 SunPlex Manager 和 Sun Management Center 的详细信息及其配置情况,请参阅第 9 章,使用图形用户界面管理 Sun Cluster。有关如何使用这些工具的具体信息,请参阅各 GUI 工具的联机帮助。
您可以通过 scsetup(1M) 实用程序交互式地执行大多数 Sun Cluster 管理任务。只要可能,本指南中的管理过程都使用 scsetup 来说明。
可以通过 scsetup 实用程序管理下列项目。
定额
资源组
群集互连
设备组和卷
专用主机名
新节点
其他群集特性
下面所列出的是用于管理 Sun Cluster 的其他命令。 有关详细信息,请参阅手册页。
表 1-1 Sun Cluster 命令行界面命令
命令 |
说明 |
---|---|
ccp(1M) |
启动远程控制台对群集的访问。 |
pmfadm(1M) |
提供到进程监视器设备的管理访问。 |
pnmset(1M) |
配置公共网络管理 (PNM)。 |
pnmstat(1M) |
报告由 PNM 监视的网络适配卡故障转移 (NAFO) 组的状态。 |
sccheck(1M) |
检查并验证 Sun Cluster 配置,以确保群集的基础配置功能有效。 |
scconf(1M) |
更新 Sun Cluster 配置。 -p 选项列出了群集配置信息。 |
scdidadm(1M) |
提供到设备 ID 配置的管理访问。 |
scgdevs(1M) |
运行全局设备名称空间管理脚本。 |
scinstall(1M) |
安装并配置 Sun Cluster 软件; 可以以交互方式或非交互方式运行。 -p 选项显示有关 Sun Cluster 软件的发行和软件包版本信息。 |
scrgadm(1M) |
管理资源类型注册、资源组的创建和资源组内资源的激活。 -p 选项显示有关已安装的资源、资源组和资源类型的信息。 |
scsetup(1M) |
运行交互式群集配置实用程序,该程序生成 scconf 命令及其各种选项。 |
scshutdown(1M) |
关闭整个群集。 |
scstat(1M) |
提供群集状态的快照。 |
scswitch(1M) |
执行一些更改,这些更改将使资源组和磁盘设备组的主节点和状态发生变化。 |
此外,还可以使用命令管理 Sun Cluster 的卷管理器部分。 这些命令的使用取决于群集中所使用的具体卷管理器(Solstice DiskSuiteTM 或 VERITAS Volume Manager)。
本节介绍管理群集的准备工作。
随着 Sun Cluster 配置的不断增长和更改,可将您本地运行环境所特有的硬件信息记录下来。这样,在需要更改或升级群集时就可以节省管理时间。 标注各种群集组件之间的电缆和连接也可以使管理更加容易。
保留原始群集配置以及随后进行的更改的记录还能帮助第三方服务供应商在为您的群集提供服务时节省所需的时间。
可以使用一个被称为管理控制台的专用 SPARC 工作站对活动群集进行管理。 通常,您要在管理控制台上安装和运行群集控制面板 (CCP) 和图形用户界面 (GUI) 工具。 有关 CCP 的详细信息,请参阅"1.4.1 如何远程登录到 Sun Cluster"。有关安装 Sun Management Center 和 SunPlex Manager GUI 工具的说明,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。
管理控制台并不是一个群集节点。 管理控制台用来远程控制群集节点(通过公共网络或通过基于网络的终端集中器)。
如果群集包含有 Sun EnterpriseTM 10000 服务器,那么您必须能够从管理控制台登录到系统服务处理器 (SSP) 并使用 netcon(1M) 命令进行连接。对于 netcon,与 Sun Enterprise 10000 域连接的缺省方法是通过网络接口进行连接。 如果网络不可访问,则会挂起通过网络连接进行的群集控制台 (cconsole) 访问。 要避免这种情况,则可以在正常的 netcon 会话中通过设置 -f 选项或发送 ~*,从而以"专用"模式使用 netcon。如果网络不可访问,您可以切换到串行接口。 有关详细信息,请参阅 netcon(1M)。
Sun Cluster 不要求专用的管理控制台,但如果使用,则具有以下好处:
通过在同一机器上给控制台和管理工具分组来启用集中化的群集管理
通过 Enterprise Services 或服务提供商来提供可能更快的故障解决方案
定期备份群集非常重要。 尽管 Sun Cluster 提供了 HA 环境,而且在存储设备中有数据的镜像副本,但这并不能代替常规备份。 Sun Cluster 可以承受多种故障,但是它并不能防护用户错误或程序错误以及灾难性故障。因此,您必须采用适当的备份过程,以防数据丢失。
备份应包含以下信息:
所有文件系统分区
所有的数据库数据(如果正在运行 DBMS 数据服务)
所有群集磁盘的磁盘分区信息
md.tab 文件(如果在使用 Solstice DiskSuite 作为卷管理器)
表 1-2 提供了管理群集的起点。
表 1-2 Sun Cluster 3.0 管理工具
操作意图 |
要执行的操作 |
详情请见 |
---|---|---|
远程登录到群集 |
使用 ccp 命令来启动群集控制面板 (CCP)。接着,选择以下图标之一: cconsole、crlogin 或 ctelnet。 | |
以互动方式配置群集 |
启动 scsetup 实用程序。 | |
显示 Sun Cluster 发行版本号和版本信息 |
使用 scinstall 命令的 -p 或者 -pv 选项。 | |
显示安装的资源、资源组和资源类型 |
使用 scrgadm -p 命令。 | |
以图形方式监视群集组件 |
使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 |
SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助 |
以图形方式管理某些群集组件 |
使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 |
SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助 |
检查群集组件的状态 |
使用 scstat 命令。 | |
查看群集配置 |
使用 scconf -p 命令。 | |
检查全局安装点 |
使用 sccheck 命令。 | |
查看 Sun Cluster 系统消息 |
检查 /var/adm/messages 文件。 |
Solaris 系统管理文档 |
监视 Solstice DiskSuite 的状态 |
使用 metastat 命令。 |
Solstice DiskSuite 文档 |
监视 VERITAS Volume Manager 的状态 |
使用 vxstat 或 vxva 命令。 |
VERITAS Volume Manager 文档 |
群集控制面板 (CCP) 为 cconsole、crlogin 和 ctelnet 等工具提供了启动板。 这三种工具都启动到一组指定的节点的一个多窗口连接。 这个多窗口连接由指定的每个节点的主窗口和一个公共窗口组成。 定向到公共窗口的输入被发送到这些主窗口中的每一个窗口,这样,您就可以在群集的所有节点上同时运行命令。 有关详细信息,请参阅 ccp(1M) 和 cconsole(1M) 手册页。
检验启动 CCP 前是否满足以下前提条件。
在管理控制台上安装了相应的 Sun Cluster 软件(SUNWccon 软件包)。
确保管理控制台上的 PATH 变量包括 Sun Cluster 工具目录: /opt/SUNWcluster/bin 和 /usr/cluster/bin。可以通过设置 $CLUSTER_HOME 环境变量为工具目录另指定一个位置。
如果使用终端集中器,请配置 clusters 文件、serialports 文件和 nsswitch.conf 文件。这些文件既可以是 /etc 文件,也可以是 NIS/NIS+ 数据库。 有关详细信息,请参阅 clusters(4) 和 serialports(4)。
请确定是否拥有 Sun Enterprise E10000 server 平台。
如果没有,请继续执行步骤 3。
如果有,则登录到系统服务处理器 (SSP) 并使用 netcon 命令进行连接。连接后,键入 Shift~@ 解除对控制台的锁定并获得写访问权。
启动 CCP 启动板。
从管理控制台,键入以下命令。
# ccp clustername |
显示 CCP 启动板。
要启动与群集的远程会话,请单击启动板中的相应图标(cconsole、crlogin 或 ctelnet)。
以下是群集控制面板的示例。
您还可以从命令行启动 cconsole、crlogin 或 ctelnet 会话。 有关详细信息,请参阅 cconsole(1M)。
scsetup(1M) 实用程序使您能够采用交互方式为群集配置定额、资源组、群集传输、专用主机名、设备组和新的节点选项。
执行这些步骤不需要作为超级用户登录。
显示 Sun Cluster 修补程序号。
Sun Cluster 的更新发行版本由主产品修补程序号和更新版本来标识,Sun Cluster 3.0 U1 的更新发行版本是 110648-05。
% showrev -p |
显示 Sun Cluster 发行版本号以及所有 Sun Cluster 软件包的版本信息。
% scinstall -pv |
以下示例显示群集的发行版本号。
% showrev -p | grep 110648 Patch:110648-05 Obsoletes: Requires: Incompatibles: Packages: |
以下示例显示了群集的发行版本信息和所有软件包的版本信息。
% scinstall -pv SunCluster 3.0 SUNWscr: 3.0.0,REV=2000.10.01.01.00 SUNWscdev: 3.0.0,REV=2000.10.01.01.00 SUNWscu: 3.0.0,REV=2000.10.01.01.00 SUNWscman: 3.0.0,REV=2000.10.01.01.00 SUNWscsal: 3.0.0,REV=2000.10.01.01.00 SUNWscsam: 3.0.0,REV=2000.10.01.01.00 SUNWscvm: 3.0.0,REV=2000.10.01.01.00 SUNWmdm: 4.2.1,REV=2000.08.08.10.01 |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
执行此步骤不需要作为超级用户登录。
显示群集的已配置资源类型、资源组和资源。
% scrgadm -p |
以下示例显示了为群集 schost 配置的资源类型 (RT Name)、资源组 (RG Name) 和资源 (RS Name)。
% scrgadm -p RT Name: SUNW.SharedAddress RT Description: HA Shared Address Resource Type RT Name: SUNW.LogicalHostname RT Description: Logical Hostname Resource Type RG Name: schost-sa-1 RG Description: RS Name: schost-1 RS Description: RS Type: SUNW.SharedAddress RS Resource Group: schost-sa-1 RG Name: schost-lh-1 RG Description: RS Name: schost-3 RS Description: RS Type: SUNW.LogicalHostname RS Resource Group: schost-lh-1 |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
执行此步骤不需要作为超级用户登录。
检查群集组件的状态。
% scstat -p |
以下是由 scstat(1M) 返回的群集组件状态信息的示例。
% scstat -p -- Cluster Nodes -- Node name Status --------- ------ Cluster node: phys-schost-1 Online Cluster node: phys-schost-2 Online Cluster node: phys-schost-3 Online Cluster node: phys-schost-4 Online ------------------------------------------------------------------ -- Cluster Transport Paths -- Endpoint Endpoint Status -------- -------- ------ Transport path: phys-schost-1:qfe1 phys-schost-4:qfe1 Path online Transport path: phys-schost-1:hme1 phys-schost-4:hme1 Path online ... ------------------------------------------------------------------ -- Quorum Summary -- Quorum votes possible: 6 Quorum votes needed: 4 Quorum votes present: 6 -- Quorum Votes by Node -- Node Name Present Possible Status --------- ------- -------- ------ Node votes: phys-schost-1 1 1 Online Node votes: phys-schost-2 1 1 Online ... -- Quorum Votes by Device -- Device Name Present Possible Status ----------- ------- -------- ------ Device votes: /dev/did/rdsk/d2s2 1 1 Online Device votes: /dev/did/rdsk/d8s2 1 1 Online ... -- Device Group Servers -- Device Group Primary Secondary ------------ ------- --------- Device group servers: rmt/1 - - Device group servers: rmt/2 - - Device group servers: schost-1 phys-schost-2 phys-schost-1 Device group servers: schost-3 - - -- Device Group Status -- Device Group Status ------------ ------ Device group status: rmt/1 Offline Device group status: rmt/2 Offline Device group status: schost-1 Online Device group status: schost-3 Offline ------------------------------------------------------------------ -- Resource Groups and Resources -- Group Name Resources ---------- --------- Resources: test-rg test_1 Resources: real-property-rg - Resources: failover-rg - Resources: descript-rg-1 - ... -- Resource Groups -- Group Name Node Name State ---------- --------- ----- Group: test-rg phys-schost-1 Offline Group: test-rg phys-schost-2 Offline ... -- Resources -- Resource Name Node Name State Status Message ------------- --------- ----- -------------- Resource: test_1 phys-schost-1 Offline Offline Resource: test_1 phys-schost-2 Offline Offline |
您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。
执行此步骤不需要作为超级用户登录。
查看群集配置
% scconf -p |
要使用 scconf 命令显示详细信息,请使用冗余选项。有关详细信息,请参阅 scconf(1M) 手册页。
以下示例列出了群集配置。
% scconf -p Cluster name: cluster-1 Cluster ID: 0x3908EE1C Cluster install mode: disabled Cluster private net: 172.16.0.0 Cluster private netmask: 255.255.0.0 Cluster new node authentication: unix Cluster new node list: <NULL - Allow any node> Cluster nodes: phys-schost-1 phys-schost-2 phys-schost-3 phys-schost-4 Cluster node name: phys-schost-1 Node ID: 1 Node enabled: yes Node private hostname: clusternode1-priv Node quorum vote count: 1 Node reservation key: 0x3908EE1C00000001 Node transport adapters: hme1 qfe1 qfe2 Node transport adapter: hme1 Adapter enabled: yes Adapter transport type: dlpi Adapter property: device_name=hme Adapter property: device_instance=1 Adapter property: dlpi_heartbeat_timeout=10000 ... Cluster transport junctions: hub0 hub1 hub2 Cluster transport junction: hub0 Junction enabled: yes Junction type: switch Junction port names: 1 2 3 4 ... Junction port: 1 Port enabled: yes Junction port: 2 Port enabled: yes ... Cluster transport cables Endpoint Endpoint State -------- -------- ----- Transport cable: phys-schost-1:hme1@0 hub0@1 Enabled Transport cable: phys-schost-1:qfe1@0 hub1@1 Enabled Transport cable: phys-schost-1:qfe2@0 hub2@1 Enabled Transport cable: phys-schost-2:hme1@0 hub0@2 Enabled ... Quorum devices: d2 d8 Quorum device name: d2 Quorum device votes: 1 Quorum device enabled: yes Quorum device name: /dev/did/rdsk/d2s2 Quorum device hosts (enabled): phys-schost-1 phys-schost-2 Quorum device hosts (disabled):... Device group name: schost-3 Device group type: SDS Device group failback enabled: no Device group node list: phys-schost-3, phys-schost-4 Diskset name: schost-3 |
sccheck(1M) 命令可用于检查并验证 Sun Cluster 的配置,以确定系统的基本配置是否正确,是否可供群集正常运行。sccheck 命令仅返回错误。如果未发现错误,sccheck 就将返回到 shell 提示符。
在执行任何可能导致设备、卷管理组件或 Sun Cluster 的配置发生更改的管理过程之后,都应运行 sccheck。
以下示例显示节点 phys-schost-3 丢失安装点 /global/schost-1。
# sccheck vfstab-check: WARNING - phys-schost-3 - Missing mount point /global/schost-1 |
sccheck (1M) 命令从 /etc/vfstab 文件中检查群集文件系统及其全局安装点的配置错误。 sccheck 命令仅返回错误。如果未发现错误,sccheck 就将返回到 shell 提示符。
在进行了影响到设备或卷管理组件的群集配置更改后,请运行 sccheck。
以下示例显示节点 phys-schost-3 丢失安装点 /global/schost-1。
# sccheck vfstab-check: WARNING - phys-schost-3 - Missing mount point /global/schost-1 |