Sun Cluster 3.0 12/01 系统管理指南

第 1 章 Sun Cluster 管理简介

本章提供了有关群集管理准备工作方面的信息并讲述了使用 Sun Cluster 管理工具的过程。

以下是本章中包含的过程的列表。

1.1 Sun Cluster 管理概述

Sun Cluster 的高可用环境可确保最终用户能够使用关键的应用程序。 系统管理员的职责就是保证 Sun Cluster 的稳定性和可操作性。

在执行管理任务前,应首先熟悉《Sun Cluster 3.0 12/01 软件安装指南》中的规划信息和《Sun Cluster 3.0 12/01 概念》文档中的术语汇编。对 Sun Cluster 的管理分为几类任务,分别在以下手册中进行说明。

在大多数情况下,可以在群集运行时执行 Sun Cluster 管理任务。这样,对群集的影响就仅限于单个节点。 对于要求关闭整个群集的那些过程,可安排在非工作时间内进行,此时对系统的影响将会最小。 如果您计划关闭群集或某个群集节点,请提前通知用户。

1.2 管理工具

您可以使用图形用户界面 (GUI) 或命令行对 Sun Cluster 执行管理任务。 本节提供了有关这些工具的概述。

1.2.1 图形用户界面

您可以用 Sun Cluster 支持的两种图形用户界面 (GUI) 工具对群集执行各种管理任务。 这些 GUI 工具是 SunPlexTM Manager 和 Sun Management Center。 有关 SunPlex Manager 和 Sun Management Center 的详细信息及其配置情况,请参阅第 9 章,使用图形用户界面管理 Sun Cluster。有关如何使用这些工具的具体信息,请参阅各 GUI 工具的联机帮助。

1.2.2 命令行界面

您可以通过 scsetup(1M) 实用程序交互式地执行大多数 Sun Cluster 管理任务。只要可能,本指南中的管理过程都使用 scsetup 来说明。

可以通过 scsetup 实用程序管理下列项目。

下面所列出的是用于管理 Sun Cluster 的其他命令。 有关详细信息,请参阅手册页。

表 1-1 Sun Cluster 命令行界面命令

命令 

说明 

ccp(1M)

启动远程控制台对群集的访问。 

pmfadm(1M)

提供到进程监视器设备的管理访问。 

pnmset(1M)

配置公共网络管理 (PNM)。 

pnmstat(1M)

报告由 PNM 监视的网络适配卡故障转移 (NAFO) 组的状态。 

sccheck(1M)

检查并验证 Sun Cluster 配置,以确保群集的基础配置功能有效。  

scconf(1M)

更新 Sun Cluster 配置。 -p 选项列出了群集配置信息。

scdidadm(1M)

提供到设备 ID 配置的管理访问。 

scgdevs(1M)

运行全局设备名称空间管理脚本。 

scinstall(1M)

安装并配置 Sun Cluster 软件; 可以以交互方式或非交互方式运行。 -p 选项显示有关 Sun Cluster 软件的发行和软件包版本信息。

scrgadm(1M)

管理资源类型注册、资源组的创建和资源组内资源的激活。 -p 选项显示有关已安装的资源、资源组和资源类型的信息。

scsetup(1M)

运行交互式群集配置实用程序,该程序生成 scconf 命令及其各种选项。

scshutdown(1M)

关闭整个群集。 

scstat(1M)

提供群集状态的快照。 

scswitch(1M)

执行一些更改,这些更改将使资源组和磁盘设备组的主节点和状态发生变化。 

此外,还可以使用命令管理 Sun Cluster 的卷管理器部分。 这些命令的使用取决于群集中所使用的具体卷管理器(Solstice DiskSuiteTM 或 VERITAS Volume Manager)。

1.3 群集管理准备

本节介绍管理群集的准备工作。

1.3.1 记录 Sun Cluster 的硬件配置

随着 Sun Cluster 配置的不断增长和更改,可将您本地运行环境所特有的硬件信息记录下来。这样,在需要更改或升级群集时就可以节省管理时间。 标注各种群集组件之间的电缆和连接也可以使管理更加容易。

保留原始群集配置以及随后进行的更改的记录还能帮助第三方服务供应商在为您的群集提供服务时节省所需的时间。

1.3.2 使用管理控制台

可以使用一个被称为管理控制台的专用 SPARC 工作站对活动群集进行管理。 通常,您要在管理控制台上安装和运行群集控制面板 (CCP) 和图形用户界面 (GUI) 工具。 有关 CCP 的详细信息,请参阅"1.4.1 如何远程登录到 Sun Cluster"。有关安装 Sun Management Center 和 SunPlex Manager GUI 工具的说明,请参阅《Sun Cluster 3.0 12/01 软件安装指南》。

管理控制台并不是一个群集节点。 管理控制台用来远程控制群集节点(通过公共网络或通过基于网络的终端集中器)。

如果群集包含有 Sun EnterpriseTM 10000 服务器,那么您必须能够从管理控制台登录到系统服务处理器 (SSP) 并使用 netcon(1M) 命令进行连接。对于 netcon,与 Sun Enterprise 10000 域连接的缺省方法是通过网络接口进行连接。 如果网络不可访问,则会挂起通过网络连接进行的群集控制台 (cconsole) 访问。 要避免这种情况,则可以在正常的 netcon 会话中通过设置 -f 选项或发送 ~*,从而以"专用"模式使用 netcon。如果网络不可访问,您可以切换到串行接口。 有关详细信息,请参阅 netcon(1M)。

Sun Cluster 不要求专用的管理控制台,但如果使用,则具有以下好处:

1.3.3 备份群集

定期备份群集非常重要。 尽管 Sun Cluster 提供了 HA 环境,而且在存储设备中有数据的镜像副本,但这并不能代替常规备份。 Sun Cluster 可以承受多种故障,但是它并不能防护用户错误或程序错误以及灾难性故障。因此,您必须采用适当的备份过程,以防数据丢失。

备份应包含以下信息:

1.4 开始管理群集

表 1-2 提供了管理群集的起点。

表 1-2 Sun Cluster 3.0 管理工具

操作意图 

要执行的操作 

详情请见 

远程登录到群集 

使用 ccp 命令来启动群集控制面板 (CCP)。接着,选择以下图标之一: cconsolecrloginctelnet

"1.4.1 如何远程登录到 Sun Cluster"

以互动方式配置群集 

启动 scsetup 实用程序。

"1.4.2 如何访问 scsetup 实用程序"

显示 Sun Cluster 发行版本号和版本信息 

使用 scinstall 命令的 -p 或者 -pv 选项。

"1.4.3 如何显示 Sun Cluster 发行版本信息和版本信息"

显示安装的资源、资源组和资源类型 

使用 scrgadm -p 命令。

"1.4.4 如何显示已配置的资源类型、资源组和资源"

以图形方式监视群集组件 

使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 

SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助

以图形方式管理某些群集组件 

使用 SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块。 

SunPlex Manager 或 Sun Management Center 的 Sun Cluster 模块的联机帮助 

检查群集组件的状态 

使用 scstat 命令。

"1.4.5 如何检查群集组件的状态"

查看群集配置 

使用 scconf -p 命令。

"1.4.6 如何查看群集配置"

检查全局安装点 

使用 sccheck 命令。

"1.4.7 如何验证基本群集配置"

查看 Sun Cluster 系统消息 

检查 /var/adm/messages 文件。

Solaris 系统管理文档 

监视 Solstice DiskSuite 的状态 

使用 metastat 命令。

Solstice DiskSuite 文档 

监视 VERITAS Volume Manager 的状态 

使用 vxstatvxva 命令。

VERITAS Volume Manager 文档 

1.4.1 如何远程登录到 Sun Cluster

群集控制面板 (CCP) 为 cconsolecrloginctelnet 等工具提供了启动板。 这三种工具都启动到一组指定的节点的一个多窗口连接。 这个多窗口连接由指定的每个节点的主窗口和一个公共窗口组成。 定向到公共窗口的输入被发送到这些主窗口中的每一个窗口,这样,您就可以在群集的所有节点上同时运行命令。 有关详细信息,请参阅 ccp(1M)cconsole(1M) 手册页。

  1. 检验启动 CCP 前是否满足以下前提条件。

    • 在管理控制台上安装了相应的 Sun Cluster 软件(SUNWccon 软件包)。

    • 确保管理控制台上的 PATH 变量包括 Sun Cluster 工具目录: /opt/SUNWcluster/bin/usr/cluster/bin。可以通过设置 $CLUSTER_HOME 环境变量为工具目录另指定一个位置。

    • 如果使用终端集中器,请配置 clusters 文件、serialports 文件和 nsswitch.conf 文件。这些文件既可以是 /etc 文件,也可以是 NIS/NIS+ 数据库。 有关详细信息,请参阅 clusters(4)serialports(4)

  2. 请确定是否拥有 Sun Enterprise E10000 server 平台。

    • 如果没有,请继续执行步骤 3

    • 如果有,则登录到系统服务处理器 (SSP) 并使用 netcon 命令进行连接。连接后,键入 Shift~@ 解除对控制台的锁定并获得写访问权。

  3. 启动 CCP 启动板。

    从管理控制台,键入以下命令。


    # ccp clustername
    

    显示 CCP 启动板。

  4. 要启动与群集的远程会话,请单击启动板中的相应图标(cconsole、crlogin 或 ctelnet)。

1.4.1.1 示例

以下是群集控制面板的示例。

图形 1-1 群集控制面板

Graphic

1.4.1.2 从此处可转到何处

您还可以从命令行启动 cconsolecrloginctelnet 会话。 有关详细信息,请参阅 cconsole(1M)

1.4.2 如何访问 scsetup 实用程序

scsetup(1M) 实用程序使您能够采用交互方式为群集配置定额、资源组、群集传输、专用主机名、设备组和新的节点选项。

  1. 成为群集中任一节点上的超级用户。

  2. 进入 scsetup 实用程序。


    # scsetup
    

    显示 Main Menu。

  3. 从菜单进行选择并按屏幕提示操作。

    有关详细信息,请参阅 scsetup 联机帮助。

1.4.3 如何显示 Sun Cluster 发行版本信息和版本信息

执行这些步骤不需要作为超级用户登录。

    显示 Sun Cluster 修补程序号。

    Sun Cluster 的更新发行版本由主产品修补程序号和更新版本来标识,Sun Cluster 3.0 U1 的更新发行版本是 110648-05。


    % showrev -p
    

    显示 Sun Cluster 发行版本号以及所有 Sun Cluster 软件包的版本信息。


    % scinstall -pv
    

1.4.3.1 示例 - 显示 Sun Cluster 发行版本号

以下示例显示群集的发行版本号。


% showrev -p | grep 110648
Patch:110648-05 Obsoletes:  Requires:  Incompatibles:  Packages:

1.4.3.2 示例 - 显示 Sun Cluster 发行版本信息和版本信息

以下示例显示了群集的发行版本信息和所有软件包的版本信息。


% scinstall -pv
SunCluster 3.0
SUNWscr:       3.0.0,REV=2000.10.01.01.00
SUNWscdev:     3.0.0,REV=2000.10.01.01.00
SUNWscu:       3.0.0,REV=2000.10.01.01.00
SUNWscman:     3.0.0,REV=2000.10.01.01.00
SUNWscsal:     3.0.0,REV=2000.10.01.01.00
SUNWscsam:     3.0.0,REV=2000.10.01.01.00
SUNWscvm:      3.0.0,REV=2000.10.01.01.00
SUNWmdm:       4.2.1,REV=2000.08.08.10.01

1.4.4 如何显示已配置的资源类型、资源组和资源

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

执行此步骤不需要作为超级用户登录。

    显示群集的已配置资源类型、资源组和资源。


    % scrgadm -p
    

1.4.4.1 示例 - 显示已配置的资源类型、资源组和资源

以下示例显示了为群集 schost 配置的资源类型 (RT Name)、资源组 (RG Name) 和资源 (RS Name)。


% scrgadm -p
RT Name: SUNW.SharedAddress
  RT Description: HA Shared Address Resource Type 
RT Name: SUNW.LogicalHostname
  RT Description: Logical Hostname Resource Type 
RG Name:
 schost-sa-1 
  RG Description:    RS Name:
 schost-1
      RS Description:      RS Type: SUNW.SharedAddress
      RS Resource Group: schost-sa-1
RG Name:
 schost-lh-1 
  RG Description:    RS Name:
 schost-3
      RS Description:      RS Type: SUNW.LogicalHostname
      RS Resource Group: schost-lh-1

1.4.5 如何检查群集组件的状态

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

执行此步骤不需要作为超级用户登录。

    检查群集组件的状态。


    % scstat -p
    

1.4.5.1 示例 - 检查群集组件的状态

以下是由 scstat(1M) 返回的群集组件状态信息的示例。


% scstat -p
-- Cluster Nodes --
 
                    Node name           Status
                    ---------           ------
  Cluster node:     phys-schost-1      Online
  Cluster node:     phys-schost-2      Online
  Cluster node:     phys-schost-3      Online
  Cluster node:     phys-schost-4      Online
 
------------------------------------------------------------------
 
-- Cluster Transport Paths --
 
                    Endpoint            Endpoint            Status
                    --------            --------            ------
  Transport path:   phys-schost-1:qfe1 phys-schost-4:qfe1 Path online
  Transport path:   phys-schost-1:hme1 phys-schost-4:hme1 Path online
...
 
------------------------------------------------------------------
 
-- Quorum Summary --
 
  Quorum votes possible:      6
  Quorum votes needed:        4
  Quorum votes present:       6
 
-- Quorum Votes by Node --
 
                    Node Name           Present Possible Status
                    ---------           ------- -------- ------
  Node votes:       phys-schost-1      1        1       Online
  Node votes:       phys-schost-2      1        1       Online
...
 
-- Quorum Votes by Device --
 
                    Device Name         Present Possible Status 
                    -----------         ------- -------- ------ 
  Device votes:     /dev/did/rdsk/d2s2  1        1       Online 
  Device votes:     /dev/did/rdsk/d8s2  1        1       Online 
...
 
-- Device Group Servers --
 
                         Device Group        Primary             Secondary
                         ------------        -------             ---------
  Device group servers:  rmt/1               -                   -
  Device group servers:  rmt/2               -                   -
  Device group servers:  schost-1           phys-schost-2      phys-schost-1
  Device group servers:  schost-3           -                   -
 
-- Device Group Status --
 
                              Device Group        Status              
                              ------------        ------              
  Device group status:        rmt/1               Offline
  Device group status:        rmt/2               Offline
  Device group status:        schost-1           Online
  Device group status:        schost-3           Offline
 
------------------------------------------------------------------
 
-- Resource Groups and Resources --
 
            Group Name          Resources
            ----------          ---------
 Resources: test-rg             test_1
 Resources: real-property-rg    -
 Resources: failover-rg         -
 Resources: descript-rg-1       -
...
 
-- Resource Groups --
 
            Group Name          Node Name           State
            ----------          ---------           -----
     Group: test-rg             phys-schost-1      Offline
     Group: test-rg             phys-schost-2      Offline
...
 
-- Resources --
 
            Resource Name       Node Name           State     Status Message
            -------------       ---------           -----     --------------
  Resource: test_1              phys-schost-1      Offline   Offline
  Resource: test_1              phys-schost-2      Offline   Offline

1.4.6 如何查看群集配置

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

执行此步骤不需要作为超级用户登录。

    查看群集配置


    % scconf -p
    

    要使用 scconf 命令显示详细信息,请使用冗余选项。有关详细信息,请参阅 scconf(1M) 手册页。

1.4.6.1 示例 - 查看群集配置

以下示例列出了群集配置。


% scconf -p
Cluster name:                       cluster-1
Cluster ID:                         0x3908EE1C
Cluster install mode:               disabled
Cluster private net:                172.16.0.0
Cluster private netmask:            255.255.0.0
Cluster new node authentication:    unix
Cluster new node list:              <NULL - Allow any node>
Cluster nodes:                      phys-schost-1 phys-schost-2 phys-schost-3
phys-schost-4
Cluster node name:                                 phys-schost-1
  Node ID:                                         1
  Node enabled:                                    yes
  Node private hostname:                           clusternode1-priv
  Node quorum vote count:                          1
  Node reservation key:                            0x3908EE1C00000001
  Node transport adapters:                         hme1 qfe1 qfe2
 
Node transport adapter:                          hme1
    Adapter enabled:                               yes
    Adapter transport type:                        dlpi
    Adapter property:                              device_name=hme
    Adapter property:                              device_instance=1
    Adapter property:                              dlpi_heartbeat_timeout=10000
...
Cluster transport junctions:                       hub0 hub1 hub2
 
Cluster transport junction:                        hub0
  Junction enabled:                                yes
  Junction type:                                   switch
  Junction port names:                             1 2 3 4
...
Junction port:                                   1
    Port enabled:                                  yes
 
Junction port:                                   2
    Port enabled:                                  yes
...
Cluster transport cables
                    Endpoint            Endpoint        State
                    --------            --------        -----
  Transport cable:  phys-schost-1:hme1@0 hub0@1        Enabled
  Transport cable:  phys-schost-1:qfe1@0 hub1@1        Enabled
  Transport cable:  phys-schost-1:qfe2@0 hub2@1        Enabled
  Transport cable:  phys-schost-2:hme1@0 hub0@2        Enabled
...
Quorum devices:                                    d2 d8
 
Quorum device name:                                d2
  Quorum device votes:                             1
  Quorum device enabled:                           yes
  Quorum device name:                              /dev/did/rdsk/d2s2
  Quorum device hosts (enabled):
                   phys-schost-1
 phys-schost-2
  Quorum device hosts (disabled):...
Device group name:                                 schost-3
  Device group type:                               SDS
  Device group failback enabled:                   no
  Device group node list:                          phys-schost-3, phys-schost-4
  Diskset name:                                    schost-3

1.4.7 如何验证基本群集配置

sccheck(1M) 命令可用于检查并验证 Sun Cluster 的配置,以确定系统的基本配置是否正确,是否可供群集正常运行。sccheck 命令仅返回错误。如果未发现错误,sccheck 就将返回到 shell 提示符。


注意:

在执行任何可能导致设备、卷管理组件或 Sun Cluster 的配置发生更改的管理过程之后,都应运行 sccheck


  1. 成为群集中任一节点上的超级用户。

  2. 检验群集配置。


    # sccheck
    

1.4.7.1 示例 - 查看群集配置

以下示例显示节点 phys-schost-3 丢失安装点 /global/schost-1


# sccheck
vfstab-check: WARNING - phys-schost-3 - Missing mount point /global/schost-1

1.4.8 如何检查全局安装点

sccheck (1M) 命令从 /etc/vfstab 文件中检查群集文件系统及其全局安装点的配置错误。 sccheck 命令仅返回错误。如果未发现错误,sccheck 就将返回到 shell 提示符。


注意:

在进行了影响到设备或卷管理组件的群集配置更改后,请运行 sccheck


  1. 成为群集中任一节点上的超级用户。

  2. 检验群集配置。


    # sccheck
    

1.4.8.1 示例 - 检查全局安装点

以下示例显示节点 phys-schost-3 丢失安装点 /global/schost-1


# sccheck
vfstab-check: WARNING - phys-schost-3 - Missing mount point /global/schost-1