Sun Cluster 3.0 U1 系统管理指南

第 1 章 Sun Cluster 管理导言

本章提供有关群集管理的准备工作的信息和使用 Sun Cluster 管理工具的步骤。

以下是本章中包含的过程的列表。

1.1 Sun Cluster 管理概述

Sun Cluster 的高可用环境确保关键应用程序对最终用户可用。系统管理员的工作是确保 Sun Cluster 稳定且可操作。

在接受管理任务前,您应当已经熟悉《Sun Cluster 3.0 U1 安装指南》中的规划信息和《Sun Cluster 3.0 U1 概念》文档中的词汇表。Sun Cluster 群集管理在以下手册中分成了若干项任务。

通常,您可以在群集运行时执行 Sun Cluster 管理任务,这样,对群集的影响就仅限于单独一个节点。对于需要关闭整个群集的步骤,请为关闭的小时数计划关闭时间,使对系统的影响减到最小。如果您计划拆卸群集或群集节点,请提前通知用户。

1.2 管理工具

您可以使用图形用户界面 (GUI) 或命令行在 Sun Cluster 上执行管理任务。本节提供了这些工具的概述。

1.2.1 图形用户界面

您可以用 Sun Cluster 支持的两种图形用户界面 (GUI) 工具在群集上执行各种管理任务。这两个 GUI 工具是 SunPlex Manager 和 Sun Management Center。有关详细信息以及配置 SunPlex Manager 和 Sun Management Center 的步骤,请参阅第 9 章, 使用图形用户界面管理 Sun Cluster。有关如何使用这些工具的具体信息,请参阅每种 GUI 工具的联机帮助。

1.2.2 命令行界面

您可以通过 scsetup(1M) 实用程序执行大多数 Sun Cluster 管理任务。在可能的时候,本指南中就会使用 scsetup 描述管理步骤。

您可以通过 scsetup 实用程序管理以下条目。

下面列出的是其它用来管理 Sun Cluster 的命令。有关详细信息,请参阅手册页。

表 1-1 Sun Cluster 命令行界面命令

命令 

说明 

ccp(1M)

启动远程控制台对群集的访问。 

pmfadm(1M)

提供到进程监视器设备的管理访问。 

pnmset(1M)

配置公共网络管理 (PNM)。 

pnmstat(1M)

报告由 PNM 监视的网络适配卡故障转移 (NAFO) 组的状态。 

sccheck(1M)

检查并验证 /etc/vfstab 文件中的全局安装条目。

scconf(1M)

更新 Sun Cluster 配置。-p 选项列出了群集配置信息。

scdidadm(1M)

提供到设备 ID 配置的管理访问。 

scgdevs(1M)

运行全局设备名称空间管理脚本。 

scinstall(1M)

安装并管理 Sun Cluster 软件;可以互动运行,也可以不互动。-p 选项显示 Sun Cluster 软件的发行和包装版本信息。

scrgadm(1M)

管理资源类型注册、资源组的创建和资源组内资源的激活。-p 选项显示有关安装的资源、资源组和资源类型的信息。

scsetup(1M)

运行交互式群集配置实用程序,它将生成 scconf 命令及其各种选项。

scshutdown(1M)

关闭整个群集。 

scstat(1M)

提供群集状态的快照。 

scswitch(1M)

为资源组和磁盘设备组执行影响节点主和状态的更改。 

此外,可以使用命令来管理 Sun Cluster 的卷管理器部分。这些命令的使用取决于群集中的特定的管理器(Solstice DiskSuiteTM 或者 VERITAS Volume Manager)。

1.3 群集管理准备

本节讲述为管理群集做什么准备。

1.3.1 记录并保存 Sun Cluster 硬件配置资料

随着 Sun Cluster 配置的不断增长和更改,可将您的环境所特有的硬件信息记录并保存起来,这样,在需要更改或升级集群时就可以节省管理时间。标注各种群集组件之间的电缆和连接也可以使管理更加容易。

保留原始群集配置的记录和后来进行的更改, 还能帮助第三方服务供应商在为您的群集提供服务时, 节省所需的时间。

1.3.2 使用管理控制台

您可以使用专用的 SPARC 工作站(称为管理控制台)管理活动的群集。通常,您要在管理控制台上安装和运行群集控制面板 (CCP) 和图形用户界面 (GUI) 工具。有关 CCP 的详细信息,请参阅"1.4.1 如何远程登录到 Sun Cluster"。有关安装 Sun Management Center 和 SunPlex Manager GUI 工具的说明,请参阅《Sun Cluster 3.0 U1 安装指南》。

管理控制台并不是一个群集节点。管理控制台用来远程控制群集节点,或者通过公共网络,或者通过基于网络的终端集中器。

如果您的群集由 Sun EnterpriseTM 10000 服务器组成,您必须能够从管理控制台登录到系统服务处理器 (SSP),并且能够使用 netcon(1M) 命令进行连接。对于 netcon,与 Sun Enterprise 10000 域连接的缺省方法是通过网络接口进行连接。如果该网络不可访问,就会挂起通过网络连接对群集控制台 (cconsole) 进行的访问。为了防止上述情况的发生,您可以在 "exclusive" 模式下使用 netcon,具体方法是:设置 -f 选项或发送 ~*(在正常的 netcon 会话期间)。如果网络不可访问,您可以切换到串行接口。有关详细信息,请参阅 netcon(1M)。

Sun Cluster 不需要专用的管理控制台,但如果使用,则具有以下好处:

1.3.3 备份群集

定期备份群集非常重要。虽然 Sun Cluster 提供了 HA 环境,并在存储设备上保存了数据的镜像副本,但不能认为可以使用此方法取代常规备份。Sun Cluster 可以不受多种故障的影响,但无法避免用户错误或程序错误或灾难性的故障。因此,您必须采用适当的备份过程,以防数据丢失。

备份应包含以下信息:

1.4 开始管理群集

表 1-2 提供了一个管理群集的开始点。

表 1-2 Sun Cluster 3.0 管理工具

操作意图 

要执行的操作 

详情请见 

远程登录到群集 

使用 ccp 命令来启动群集控制面板 (CCP)。接着,选择以下图标之一:cconsolecrloginctelnet

"1.4.1 如何远程登录到 Sun Cluster"

以互动方式配置群集 

启动 scsetup 实用程序。

"1.4.2 如何访问 scsetup 实用程序"

显示 Sun Cluster 发行版本号和版本信息 

使用 scinstall 命令并使用选项 -p 或者 -pv

"1.4.3 如何显示 Sun Cluster 发行版本和版本信息"

显示安装的资源、资源组和资源类型 

使用 scrgadm -p 命令。

"1.4.4 如何显示已配置的资源类型、资源组和资源"

以图形方式监视群集组件 

使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 

SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助

以图形方式管理某些群集组件 

使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 

SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助 

检查群集组件的状态 

使用 scstat 命令。

"1.4.5 如何检查群集组件的状态"

查看群集配置 

使用 scconf -p 命令。

"1.4.6 如何查看群集配置"

检查全局安装点 

使用 sccheck 命令。

"1.4.7 如何检查全局安装点"

查看 Sun Cluster 系统信息 

检查 /var/adm/messages 文件。

Solaris 系统管理文档 

监视 Solstice DiskSuite 的状态 

使用 metastat 命令。

Solstice DiskSuite 文档 

监视 VERITAS Volume Manager 的状态 

使用 vxstatvxva 命令。

VERITAS Volume Manager 文档 

1.4.1 如何远程登录到 Sun Cluster

Cluster Control Panel (CCP) 为 cconsolecrloginctelnet 工具提供一个启动板。这三种工具都启动到一组指定的节点的一个多窗口连接。这个多窗口连接由指定的每个节点的主窗口和一个公共窗口组成。定向到公共窗口的输入被发送到这些主窗口中的每一个窗口,这样,您就可以在群集的所有节点上同时运行命令。有关详细信息,请参阅 ccp(1M)cconsole(1M) 手册页。

  1. 检验启动 CCP 前是否满足以下前提条件。

    • 在管理控制台上安装相应的 Sun Cluster 软件(SUNWccon 软件包)。

    • 确保管理控制台上的 PATH 变量包括 Sun Cluster 工具目录:/opt/SUNWcluster/bin/usr/cluster/bin。可以通过设置 $CLUSTER_HOME 环境变量为工具目录另指定一个位置。

    • 如果使用终端集中器,请配置 clusters 文件、serialports 文件和 nsswitch.conf 文件。这些文件可以是 /etc 文件或 NIS/NIS+ 数据库。有关更多信息,请参阅 clusters(4)serialports(4)

  2. 确定是否有 Sun Enterprise E10000 server 平台。

    • 如果没有,则继续执行步骤 3

    • 如果有,则登录到系统服务处理器 (SSP) 并使用 netcon 命令进行连接。连接后,键入 Shift~@ 解除对控制台的锁定并获得写访问权。

  3. 启动 CCP 启动板。

    从管理控制台,键入以下命令。


    # ccp clustername
    

    显示 CCP 启动板。

  4. 要启动与群集的远程会话,请单击启动板中的相应图标(cconsole、crlogin 或 ctelnet)。

1.4.1.1 示例

以下示例说明 Cluster Control Panel。

图形 1-1 Cluster Control Panel

Graphic

1.4.1.2 从此处可转到何处

还可以从命令行启动 cconsolecrloginctelnet 会话。有关详细信息,请参阅 cconsole(1M)

1.4.2 如何访问 scsetup 实用程序

通过 scsetup(1M) 实用程序,您可以采用交互方式为群集配置定额、资源组、群集传输、专用主机名、设备组和新的节点选项。

  1. 成为群集中任一节点的超级用户。

  2. 输入 scsetup 实用程序。


    # scsetup
    

    这时将显示主菜单。

  3. 从菜单进行选择并按屏幕提示操作。

    有关详细,请参阅 scsetup 联机帮助。

1.4.3 如何显示 Sun Cluster 发行版本和版本信息

执行这些步骤不需要作为超级用户登录。

    显示 Sun Cluster 修补程序号。

    Sun Cluster 的更新发行版本由主产品修补程序号和更新版本来标识,Sun Cluster 3.0 U1 的更新发行版本是 110648-05。


    % showrev -p
    

    显示所有 Sun Cluster 软件包的 Sun Cluster 发行版本号和版本字符串。


    % scinstall -pv
    

1.4.3.1 示例 - 显示 Sun Cluster 的发行版本号

以下示例说明群集的发行版本号。


% showrev -p | grep 110648
Patch: 110648-05 Obsoletes:Requires:Incompatibles:Packages:

1.4.3.2 示例 - 显示 Sun Cluster 发行版本和版本信息

以下示例显示所有软件包的群集发行版本信息和版本信息。


% scinstall -pv
SunCluster 3.0
SUNWscr:3.0.0,REV=2000.10.01.01.00
SUNWscdev:     3.0.0,REV=2000.10.01.01.00
SUNWscu:       3.0.0,REV=2000.10.01.01.00
SUNWscman:     3.0.0,REV=2000.10.01.01.00
SUNWscsal:     3.0.0,REV=2000.10.01.01.00
SUNWscsam:     3.0.0,REV=2000.10.01.01.00
SUNWscvm:      3.0.0,REV=2000.10.01.01.00
SUNWmdm:       4.2.1,REV=2000.08.08.10.01

1.4.4 如何显示已配置的资源类型、资源组和资源

您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 联机帮助。

执行此步骤不需要作为超级用户登录。

    显示群集的已配置资源类型、资源组和资源。


    % scrgadm -p
    

1.4.4.1 示例 - 显示已配置的资源类型、资源组和资源

以下示例显示资源类型(RT 名称)、资源组(RG 名称)以及为群集 schost 配置的资源( RS 名称)。


% scrgadm -p
RT Name:SUNW.SharedAddress
  RT Description: HA Shared Address Resource Type
RT Name: SUNW.LogicalHostname
  RT Description: Logical Hostname Resource Type
RG Name: schost-sa-1
  RG Description:
    RS Name: schost-1
    RS Description:
    RS Type: SUNW.SharedAddress
    RS Resource Group: schost-sa-1
RG Name: schost-lh-1
  RG Description:
    RS Name: schost-3
      RS Description:
      RS Type: SUNW.LogicalHostname
      RS Resource Group: schost-lh-1

1.4.5 如何检查群集组件的状态

您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 联机帮助。

执行此步骤不需要作为超级用户登录。

    检查群集组件的状态。


    % scstat -p
    

1.4.5.1 示例 - 检查群集组件的状态

以下示例提供了由 scstat(1M) 返回的群集组件状态信息的样例。


% scstat -p
-- Cluster Nodes --
 
                    Node name           Status
                    ---------           ------
  Cluster node:     phys-schost-1      Online
  Cluster node:     phys-schost-2      Online
  Cluster node:     phys-schost-3      Online
  Cluster node:     phys-schost-4      Online
 
------------------------------------------------------------------
 
-- Cluster Transport Paths --
 
                    Endpoint            Endpoint            Status
                    --------            --------            ------
  Transport path:   phys-schost-1:qfe1 phys-schost-4:qfe1 Path online
  Transport path:   phys-schost-1:hme1 phys-schost-4:hme1 Path online
...
 
------------------------------------------------------------------
 
-- Quorum Summary --
 
  Quorum votes possible:      6
  Quorum votes needed:        4
  Quorum votes present:       6
 
-- Quorum Votes by Node --
 
                    Node Name           Present Possible Status
                    ---------           ------- -------- ------
  Node votes:       phys-schost-1      1        1       Online 
  Node votes:       phys-schost-2      1        1       Online 
...
 
-- Quorum Votes by Device --
 
                    Device Name         Present Possible Status
                    -----------         ------- -------- ------
  Device votes:     /dev/did/rdsk/d2s2  1        1       Online
  Device votes:     /dev/did/rdsk/d8s2  1        1       Online 
...
 
-- Device Group Servers --
 
                         Device Group        Primary             Secondary
                         ------------        -------             ---------
  Device group servers:  rmt/1               -                   -
  Device group servers:  rmt/2               -                   -
  Device group servers:  schost-1           phys-schost-2      phys-schost-1
  Device group servers:  schost-3           -                   -
 
-- Device Group Status --
 
                              Device Group        Status
                              ------------        ------
  Device group status:        rmt/1               Offline
  Device group status:        rmt/2               Offline
  Device group status:        schost-1           Online
  Device group status:        schost-3           Offline
 
------------------------------------------------------------------
 
-- Resource Groups and Resources --
 
            Group Name          Resources
            ----------          ---------
 Resources: test-rg             test_1
 Resources: real-property-rg    -
 Resources: failover-rg         -
 Resources: descript-rg-1       -
...
 
-- Resource Groups --
 
            Group Name          Node Name           State
            ----------          ---------           -----
     Group: test-rg             phys-schost-1      Offline
     Group: test-rg             phys-schost-2      Offline
...
 
-- Resources --
 
            Resource Name       Node Name           State     Status Message
            -------------       ---------           -----     --------------
  Resource: test_1              phys-schost-1      Offline   Offline
  Resource: test_1              phys-schost-2      Offline   Offline

1.4.6 如何查看群集配置

您还可以使用 SunPlex Manager GUI 来完成此过程。有关详细信息,请参阅 SunPlex Manager 联机帮助。

执行此步骤不需要作为超级用户登录。

    查看群集配置。


    % scconf -p
    

1.4.6.1 示例 - 查看群集配置

以下示例列出了群集配置。


% scconf -p
Cluster name:                       cluster-1
Cluster ID:                         0x3908EE1C
Cluster install mode:               disabled
Cluster private net:                1
72.16.0.0 Cluster private netmask:            255.255.0.0
Cluster new node authentication:    unix
Cluster new node list:              <NULL - Allow any node>
Cluster nodes:                      phys-schost-1 phys-schost-2 phys-schost-3
phys-schost-4 
Cluster node name:                                 phys-schost-1
  Node ID:                                         1
  Node enabled:                                    yes
  Node private hostname:                           clusternode1-priv 
  Node quorum vote count:                          1
  Node reservation key:                            0x3908EE1C00000001
  Node transport adapters:                         hme1 qfe1 qfe2
 
Node transport adapter:                          hme1
    Adapter enabled:                               yes
    Adapter transport type:                        dlpi
    Adapter property:                              device_name=hme
    Adapter property:                              device_instance=1
    Adapter property:                              dlpi_heartbeat_timeout=10000
...
Cluster transport junctions:                       hub0 hub1 hub2
 
Cluster transport junction:                        hub0
  Junction enabled:                                yes
  Junction type:                                   switch
  Junction port names:                             1 2 3 4
...
Junction port:                                   1
    Port enabled:                                  yes
 
Junction port:                                   2
    Port enabled:                                  yes
...
Cluster transport cables
                    Endpoint            Endpoint        State
                    --------            --------        -----
  Transport cable:  phys-schost-1:hme1@0 hub0@1        Enabled
  Transport cable:  phys-schost-1:qfe1@0 hub1@1        Enabled
  Transport cable:  phys-schost-1:qfe2@0 hub2@1        Enabled
  Transport cable:  phys-schost-2:hme1@0 hub0@2        Enabled
...
Quorum devices:                                    d2 d8
 
Quorum device name:                                d2
  Quorum device votes:                             1
  Quorum device enabled:                           yes
  Quorum device name:                              /dev/did/rdsk/d2s2
  Quorum device hosts (enabled):                   phys-schost-1
 phys-schost-2
  Quorum device hosts (disabled): 
...
Device group name:                                 schost-3
  Device group type:                               SDS
  Device group failback enabled:                   no
  Device group node list:                          phys-schost-3, phys-schost-4
  Diskset name:                                    schost-3

1.4.7 如何检查全局安装点

sccheck(1M) 命令从 /etc/vfstab 文件中检查群集文件系统及其全局安装点的配置错误。sccheck 命令仅返回错误。如果未发现错误,sccheck 仅返回到 shell 提示符。


注意:

在进行的配置更改已影响设备或卷管理组件后,请运行 sccheck


  1. 成为群集中任一节点的超级用户。

  2. 检验群集配置。


    # sccheck
    

1.4.7.1 示例 - 检验群集配置

以下示例显示节点 phys-schost-3 丢失安装点 /global/schost-1


# sccheck
vfstab-check:WARNING - phys-schost-3 - Missing mount point /global/schost-1