本章提供有关群集管理的准备工作的信息和使用 Sun Cluster 管理工具的步骤。
以下是本章中包含的过程的列表。
Sun Cluster 的高可用环境确保关键应用程序对最终用户可用。系统管理员的工作是确保 Sun Cluster 稳定且可操作。
在接受管理任务前,您应当已经熟悉《Sun Cluster 3.0 U1 安装指南》中的规划信息和《Sun Cluster 3.0 U1 概念》文档中的词汇表。Sun Cluster 群集管理在以下手册中分成了若干项任务。
标准任务,用于定期或者每天管理和维护群集。本指南中讲述了这些任务。
数据服务任务,比如: 安装、配置和更改特性。这些任务在《Sun Cluster 3.0 U1 Data Services Installation and Configuration Guide》中讲述。
服务任务,比如: 添加或检修存储或网络硬件。这些任务在《Sun Cluster 3.0 U1 Hardware Guide》 中讲述。
通常,您可以在群集运行时执行 Sun Cluster 管理任务,这样,对群集的影响就仅限于单独一个节点。对于需要关闭整个群集的步骤,请为关闭的小时数计划关闭时间,使对系统的影响减到最小。如果您计划拆卸群集或群集节点,请提前通知用户。
您可以使用图形用户界面 (GUI) 或命令行在 Sun Cluster 上执行管理任务。本节提供了这些工具的概述。
您可以用 Sun Cluster 支持的两种图形用户界面 (GUI) 工具在群集上执行各种管理任务。这两个 GUI 工具是 SunPlex Manager 和 Sun Management Center。有关详细信息以及配置 SunPlex Manager 和 Sun Management Center 的步骤,请参阅第 9 章, 使用图形用户界面管理 Sun Cluster。有关如何使用这些工具的具体信息,请参阅每种 GUI 工具的联机帮助。
您可以通过 scsetup(1M) 实用程序执行大多数 Sun Cluster 管理任务。在可能的时候,本指南中就会使用 scsetup 描述管理步骤。
您可以通过 scsetup 实用程序管理以下条目。
定额
资源组
群集互连
设备组和卷
专用主机名
新节点
其它群集特性
下面列出的是其它用来管理 Sun Cluster 的命令。有关详细信息,请参阅手册页。
表 1-1 Sun Cluster 命令行界面命令
命令 |
说明 |
---|---|
ccp(1M) |
启动远程控制台对群集的访问。 |
pmfadm(1M) |
提供到进程监视器设备的管理访问。 |
pnmset(1M) |
配置公共网络管理 (PNM)。 |
pnmstat(1M) |
报告由 PNM 监视的网络适配卡故障转移 (NAFO) 组的状态。 |
sccheck(1M) |
检查并验证 /etc/vfstab 文件中的全局安装条目。 |
scconf(1M) |
更新 Sun Cluster 配置。-p 选项列出了群集配置信息。 |
scdidadm(1M) |
提供到设备 ID 配置的管理访问。 |
scgdevs(1M) |
运行全局设备名称空间管理脚本。 |
scinstall(1M) |
安装并管理 Sun Cluster 软件;可以互动运行,也可以不互动。-p 选项显示 Sun Cluster 软件的发行和包装版本信息。 |
scrgadm(1M) |
管理资源类型注册、资源组的创建和资源组内资源的激活。-p 选项显示有关安装的资源、资源组和资源类型的信息。 |
scsetup(1M) |
运行交互式群集配置实用程序,它将生成 scconf 命令及其各种选项。 |
scshutdown(1M) |
关闭整个群集。 |
scstat(1M) |
提供群集状态的快照。 |
scswitch(1M) |
为资源组和磁盘设备组执行影响节点主和状态的更改。 |
此外,可以使用命令来管理 Sun Cluster 的卷管理器部分。这些命令的使用取决于群集中的特定的管理器(Solstice DiskSuiteTM 或者 VERITAS Volume Manager)。
本节讲述为管理群集做什么准备。
随着 Sun Cluster 配置的不断增长和更改,可将您的环境所特有的硬件信息记录并保存起来,这样,在需要更改或升级集群时就可以节省管理时间。标注各种群集组件之间的电缆和连接也可以使管理更加容易。
保留原始群集配置的记录和后来进行的更改, 还能帮助第三方服务供应商在为您的群集提供服务时, 节省所需的时间。
您可以使用专用的 SPARC 工作站(称为管理控制台)管理活动的群集。通常,您要在管理控制台上安装和运行群集控制面板 (CCP) 和图形用户界面 (GUI) 工具。有关 CCP 的详细信息,请参阅"1.4.1 如何远程登录到 Sun Cluster"。有关安装 Sun Management Center 和 SunPlex Manager GUI 工具的说明,请参阅《Sun Cluster 3.0 U1 安装指南》。
管理控制台并不是一个群集节点。管理控制台用来远程控制群集节点,或者通过公共网络,或者通过基于网络的终端集中器。
如果您的群集由 Sun EnterpriseTM 10000 服务器组成,您必须能够从管理控制台登录到系统服务处理器 (SSP),并且能够使用 netcon(1M) 命令进行连接。对于 netcon,与 Sun Enterprise 10000 域连接的缺省方法是通过网络接口进行连接。如果该网络不可访问,就会挂起通过网络连接对群集控制台 (cconsole) 进行的访问。为了防止上述情况的发生,您可以在 "exclusive" 模式下使用 netcon,具体方法是:设置 -f 选项或发送 ~*(在正常的 netcon 会话期间)。如果网络不可访问,您可以切换到串行接口。有关详细信息,请参阅 netcon(1M)。
Sun Cluster 不需要专用的管理控制台,但如果使用,则具有以下好处:
通过在同一机器上给控制台和管理工具分组来启用集中化的群集管理
通过 Enterprise Services 或服务提供商来提供可能更快的故障解决方案
定期备份群集非常重要。虽然 Sun Cluster 提供了 HA 环境,并在存储设备上保存了数据的镜像副本,但不能认为可以使用此方法取代常规备份。Sun Cluster 可以不受多种故障的影响,但无法避免用户错误或程序错误或灾难性的故障。因此,您必须采用适当的备份过程,以防数据丢失。
备份应包含以下信息:
所有文件系统分区
所有的数据库数据(如果正在运行 DBMS 数据服务)
所有群集磁盘的磁盘分区信息
md.tab 文件(如果在使用 Solstice DiskSuite 作为卷管理器)
表 1-2 提供了一个管理群集的开始点。
表 1-2 Sun Cluster 3.0 管理工具
操作意图 |
要执行的操作 |
详情请见 |
---|---|---|
远程登录到群集 |
使用 ccp 命令来启动群集控制面板 (CCP)。接着,选择以下图标之一:cconsole、crlogin 或 ctelnet。 | |
以互动方式配置群集 |
启动 scsetup 实用程序。 | |
显示 Sun Cluster 发行版本号和版本信息 |
使用 scinstall 命令并使用选项 -p 或者 -pv | |
显示安装的资源、资源组和资源类型 |
使用 scrgadm -p 命令。 | |
以图形方式监视群集组件 |
使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 |
SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助 |
以图形方式管理某些群集组件 |
使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 |
SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助 |
检查群集组件的状态 |
使用 scstat 命令。 | |
查看群集配置 |
使用 scconf -p 命令。 | |
检查全局安装点 |
使用 sccheck 命令。 | |
查看 Sun Cluster 系统信息 |
检查 /var/adm/messages 文件。 |
Solaris 系统管理文档 |
监视 Solstice DiskSuite 的状态 |
使用 metastat 命令。 |
Solstice DiskSuite 文档 |
监视 VERITAS Volume Manager 的状态 |
使用 vxstat 或 vxva 命令。 |
VERITAS Volume Manager 文档 |
Cluster Control Panel (CCP) 为 cconsole、crlogin 和 ctelnet 工具提供一个启动板。这三种工具都启动到一组指定的节点的一个多窗口连接。这个多窗口连接由指定的每个节点的主窗口和一个公共窗口组成。定向到公共窗口的输入被发送到这些主窗口中的每一个窗口,这样,您就可以在群集的所有节点上同时运行命令。有关详细信息,请参阅 ccp(1M) 和 cconsole(1M) 手册页。
检验启动 CCP 前是否满足以下前提条件。
在管理控制台上安装相应的 Sun Cluster 软件(SUNWccon 软件包)。
确保管理控制台上的 PATH 变量包括 Sun Cluster 工具目录:/opt/SUNWcluster/bin 和 /usr/cluster/bin。可以通过设置 $CLUSTER_HOME 环境变量为工具目录另指定一个位置。
如果使用终端集中器,请配置 clusters 文件、serialports 文件和 nsswitch.conf 文件。这些文件可以是 /etc 文件或 NIS/NIS+ 数据库。有关更多信息,请参阅 clusters(4) 和 serialports(4)
确定是否有 Sun Enterprise E10000 server 平台。
如果没有,则继续执行步骤 3。
如果有,则登录到系统服务处理器 (SSP) 并使用 netcon 命令进行连接。连接后,键入 Shift~@ 解除对控制台的锁定并获得写访问权。
启动 CCP 启动板。
从管理控制台,键入以下命令。
# ccp clustername |
显示 CCP 启动板。
要启动与群集的远程会话,请单击启动板中的相应图标(cconsole、crlogin 或 ctelnet)。
以下示例说明 Cluster Control Panel。
还可以从命令行启动 cconsole、crlogin 或 ctelnet 会话。有关详细信息,请参阅 cconsole(1M)
通过 scsetup(1M) 实用程序,您可以采用交互方式为群集配置定额、资源组、群集传输、专用主机名、设备组和新的节点选项。
执行这些步骤不需要作为超级用户登录。
显示 Sun Cluster 修补程序号。
Sun Cluster 的更新发行版本由主产品修补程序号和更新版本来标识,Sun Cluster 3.0 U1 的更新发行版本是 110648-05。
% showrev -p |
显示所有 Sun Cluster 软件包的 Sun Cluster 发行版本号和版本字符串。
% scinstall -pv |
以下示例说明群集的发行版本号。
% showrev -p | grep 110648 Patch: 110648-05 Obsoletes:Requires:Incompatibles:Packages: |
以下示例显示所有软件包的群集发行版本信息和版本信息。
% scinstall -pv SunCluster 3.0 SUNWscr:3.0.0,REV=2000.10.01.01.00 SUNWscdev: 3.0.0,REV=2000.10.01.01.00 SUNWscu: 3.0.0,REV=2000.10.01.01.00 SUNWscman: 3.0.0,REV=2000.10.01.01.00 SUNWscsal: 3.0.0,REV=2000.10.01.01.00 SUNWscsam: 3.0.0,REV=2000.10.01.01.00 SUNWscvm: 3.0.0,REV=2000.10.01.01.00 SUNWmdm: 4.2.1,REV=2000.08.08.10.01 |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 联机帮助。
执行此步骤不需要作为超级用户登录。
显示群集的已配置资源类型、资源组和资源。
% scrgadm -p |
以下示例显示资源类型(RT 名称)、资源组(RG 名称)以及为群集 schost 配置的资源( RS 名称)。
% scrgadm -p RT Name:SUNW.SharedAddress RT Description: HA Shared Address Resource Type RT Name: SUNW.LogicalHostname RT Description: Logical Hostname Resource Type RG Name: schost-sa-1 RG Description: RS Name: schost-1 RS Description: RS Type: SUNW.SharedAddress RS Resource Group: schost-sa-1 RG Name: schost-lh-1 RG Description: RS Name: schost-3 RS Description: RS Type: SUNW.LogicalHostname RS Resource Group: schost-lh-1 |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 联机帮助。
执行此步骤不需要作为超级用户登录。
检查群集组件的状态。
% scstat -p |
以下示例提供了由 scstat(1M) 返回的群集组件状态信息的样例。
% scstat -p -- Cluster Nodes -- Node name Status --------- ------ Cluster node: phys-schost-1 Online Cluster node: phys-schost-2 Online Cluster node: phys-schost-3 Online Cluster node: phys-schost-4 Online ------------------------------------------------------------------ -- Cluster Transport Paths -- Endpoint Endpoint Status -------- -------- ------ Transport path: phys-schost-1:qfe1 phys-schost-4:qfe1 Path online Transport path: phys-schost-1:hme1 phys-schost-4:hme1 Path online ... ------------------------------------------------------------------ -- Quorum Summary -- Quorum votes possible: 6 Quorum votes needed: 4 Quorum votes present: 6 -- Quorum Votes by Node -- Node Name Present Possible Status --------- ------- -------- ------ Node votes: phys-schost-1 1 1 Online Node votes: phys-schost-2 1 1 Online ... -- Quorum Votes by Device -- Device Name Present Possible Status ----------- ------- -------- ------ Device votes: /dev/did/rdsk/d2s2 1 1 Online Device votes: /dev/did/rdsk/d8s2 1 1 Online ... -- Device Group Servers -- Device Group Primary Secondary ------------ ------- --------- Device group servers: rmt/1 - - Device group servers: rmt/2 - - Device group servers: schost-1 phys-schost-2 phys-schost-1 Device group servers: schost-3 - - -- Device Group Status -- Device Group Status ------------ ------ Device group status: rmt/1 Offline Device group status: rmt/2 Offline Device group status: schost-1 Online Device group status: schost-3 Offline ------------------------------------------------------------------ -- Resource Groups and Resources -- Group Name Resources ---------- --------- Resources: test-rg test_1 Resources: real-property-rg - Resources: failover-rg - Resources: descript-rg-1 - ... -- Resource Groups -- Group Name Node Name State ---------- --------- ----- Group: test-rg phys-schost-1 Offline Group: test-rg phys-schost-2 Offline ... -- Resources -- Resource Name Node Name State Status Message ------------- --------- ----- -------------- Resource: test_1 phys-schost-1 Offline Offline Resource: test_1 phys-schost-2 Offline Offline |
您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 联机帮助。
执行此步骤不需要作为超级用户登录。
查看群集配置。
% scconf -p |
以下示例列出了群集配置。
% scconf -p Cluster name: cluster-1 Cluster ID: 0x3908EE1C Cluster install mode: disabled Cluster private net: 1 72.16.0.0 Cluster private netmask: 255.255.0.0 Cluster new node authentication: unix Cluster new node list: <NULL - Allow any node> Cluster nodes: phys-schost-1 phys-schost-2 phys-schost-3 phys-schost-4 Cluster node name: phys-schost-1 Node ID: 1 Node enabled: yes Node private hostname: clusternode1-priv Node quorum vote count: 1 Node reservation key: 0x3908EE1C00000001 Node transport adapters: hme1 qfe1 qfe2 Node transport adapter: hme1 Adapter enabled: yes Adapter transport type: dlpi Adapter property: device_name=hme Adapter property: device_instance=1 Adapter property: dlpi_heartbeat_timeout=10000 ... Cluster transport junctions: hub0 hub1 hub2 Cluster transport junction: hub0 Junction enabled: yes Junction type: switch Junction port names: 1 2 3 4 ... Junction port: 1 Port enabled: yes Junction port: 2 Port enabled: yes ... Cluster transport cables Endpoint Endpoint State -------- -------- ----- Transport cable: phys-schost-1:hme1@0 hub0@1 Enabled Transport cable: phys-schost-1:qfe1@0 hub1@1 Enabled Transport cable: phys-schost-1:qfe2@0 hub2@1 Enabled Transport cable: phys-schost-2:hme1@0 hub0@2 Enabled ... Quorum devices: d2 d8 Quorum device name: d2 Quorum device votes: 1 Quorum device enabled: yes Quorum device name: /dev/did/rdsk/d2s2 Quorum device hosts (enabled): phys-schost-1 phys-schost-2 Quorum device hosts (disabled): ... Device group name: schost-3 Device group type: SDS Device group failback enabled: no Device group node list: phys-schost-3, phys-schost-4 Diskset name: schost-3 |
sccheck(1M) 命令从 /etc/vfstab 文件中检查群集文件系统及其全局安装点的配置错误。sccheck 命令仅返回错误。如果未发现错误,sccheck 仅返回到 shell 提示符。
在进行的配置更改已影响设备或卷管理组件后,请运行 sccheck
以下示例显示节点 phys-schost-3 丢失安装点 /global/schost-1。
# sccheck vfstab-check:WARNING - phys-schost-3 - Missing mount point /global/schost-1 |