Sun Cluster 软件安装指南(适用于 Solaris OS)

第 3 章 建立群集

本章介绍了如何建立群集或新群集节点的过程。本章包含下列过程:

建立新的群集或群集节点

本节提供了建立新群集或向现有群集添加节点的信息和过程。开始执行这些任务之前,请确保您已按照安装该软件所述安装了 Solaris OS、Sun Cluster 框架及其他产品所需的软件包。


注 –

您也可以通过为 Sun N1TM Service Provisioning System 部署 Sun Cluster 插件来创建多节点群集或将节点添加到现有群集中。 请按照插件附带的文档中的说明操作。也可以在 中访问此信息。


以下任务表列出了要执行的任务。按照以下顺序完成操作。

表 3–1 任务表:建立群集

方法 

指导 

1. 使用以下方法之一建立新群集或向现有群集中添加节点: 

  • 仅限于新群集)使用 scinstall 实用程序建立群集。

如何在所有节点上配置 Sun Cluster 软件 (scinstall)

  • 仅限于新群集)使用 XML 配置文件建立群集。

如何在所有节点上配置 Sun Cluster 软件 (XML)

  • 限于新群集或添加的节点)设置 JumpStart 安装服务器。然后,创建已安装系统的 Flash 归档文件。最后,使用 scinstall JumpStart 选项在每个节点上安装 Flash 归档文件并建立群集。

如何安装 Solaris 和 Sun Cluster 软件 (JumpStart)

  • 仅限于添加的节点)使用 clsetup 命令将新节点添加到群集授权节点列表中。如有必要,还应配置群集互连并重新配置专用网络地址范围。

    在新节点上使用 scinstall 实用程序或 XML 配置文件配置 Sun Cluster 软件。

如何在添加群集节点之前做好群集准备工作

如何在添加节点或专用网络时更改专用网络配置

如何在附加群集节点上配置 Sun Cluster 软件 (scinstall)

如何在新增的群集节点上配置 Sun Cluster 软件 (XML)

2. 如果向群集中添加了节点,请更新法定配置信息。 

如何在向群集中添加节点后更新法定设备

3. 分配法定选票并使群集脱离安装模式(如果尚未执行此操作)。 

如何配置法定设备

4. 验证法定配置。 

如何检验定额配置和安装模式

5.(可选)更改节点的专用主机名。

如何更改专用主机名

6. 创建或修改 NTP 配置文件(如果尚未配置)。 

如何配置网络时间协议 (NTP)

7. 如果使用卷管理器,请安装卷管理软件。 

第 4 章,配置 Solaris Volume Manager 软件第 5 章,安装和配置 VERITAS 卷管理器

8. 根据需要创建群集文件系统或高可用性本地文件系统。 

如何创建群集文件系统《Sun Cluster Data Services Planning and Administration Guide for Solaris OS》中的“Enabling Highly Available Local File Systems”

9.(可选)SPARC:配置 Sun Management Center 以监视群集。

SPARC: 为 Sun Management Center 安装 Sun Cluster 模块

10. 安装第三方应用程序、注册资源类型、设置资源组并配置数据服务。 

《Sun Cluster Data Services Planning and Administration Guide for Solaris OS》

应用程序软件附带的文档 

11. 记录已完成群集配置的基本信息。 

如何记录群集配置的诊断数据

Procedure如何在所有节点上配置 Sun Cluster 软件 (scinstall)

从群集的一个节点中执行此过程,以便在群集的所有节点上配置 Sun Cluster 软件。


注 –

此过程使用的是 scinstall 命令的交互形式。要使用 scinstall 命令的非交互形式(如在开发安装脚本时),请参见 scinstall(1M) 手册页。

在运行 scinstall 命令之前,请确保已在节点上安装了 Sun Cluster 软件包,手动安装或使用 Java ES installer 程序的无提示模式安装均可。有关通过安装脚本运行 Java ES installer 程序的信息,请参见 《Sun Java Enterprise System 5 Installation Guide for UNIX》中的第 5  章 “Installing in Silent Mode”


开始之前

执行以下任务:

按照以下指导信息在此过程中使用交互式的 scinstall 实用程序:

  1. 如果在 Sun Cluster 软件的安装过程中禁用了远程配置,请重新启用远程配置。

    对所有群集节点启用 超级用户的远程 shell (rsh(1M)) 或安全 shell (ssh(1)) 访问权限。

  2. 如果要在新群集的专用互连中使用交换机,请确保邻居发现协议 (Neighbor Discovery Protocol, NDP) 处于禁用状态。

    请按照交换机文档中的过程来确定是否启用和禁用 NDP。

    在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包, 则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。

    建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。

  3. 在要用来配置群集的群集节点上成为超级用户。

  4. 启动 scinstall 实用程序。


    phys-schost# /usr/cluster/bin/scinstall
    
  5. 键入 "Create a New Cluster or Add a Cluster Node" 所对应的选项号并按回车键。


     *** Main Menu ***
    
        Please select from one of the following (*) options:
    
          * 1) Create a new cluster or add a cluster node
            2) Configure a cluster to be JumpStarted from this install server
            3) Manage a dual-partition upgrade
            4) Upgrade this cluster node
          * 5) Print release information for this cluster node
     
          * ?) Help with menu options
          * q) Quit
    
        Option:  1
    

    将显示 "New Cluster and Cluster Node" 菜单。

  6. 键入 "Create a New Cluster" 所对应的选项号并按回车键。

    将显示 "Typical or Custom Mode" 菜单。

  7. 键入 "Typical" 或 "Custom"所对应的选项号并按回车键。

    将显示 "Create a New Cluster" 屏幕。阅读相关要求,然后按 Ctrl-D 组合键继续。

  8. 按照菜单提示给出您的答案,所做回答应依据于您在配置规划工作单中填写的内容。

    scinstall 实用程序用于安装和配置所有群集节点并重新引导群集。将所有节点成功引导到群集中之后,即建立了群集。安装 Sun Cluster 的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。

  9. 对于 Solaris 10 OS,请在每个节点上检验服务器管理工具 (Service Management Facility, SMF) 的多用户服务是否联机。

    如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。


    phys-schost# svcs multi-user-server node
    STATE          STIME    FMRI
    online         17:52:55 svc:/milestone/multi-user-server:default
  10. 在一个节点上成为超级用户。

  11. 检验所有节点是否都已加入群集。


    phys-schost# clnode status
    

    输出类似于以下内容。


    === Cluster Nodes ===
    
    --- Node Status ---
    
    Node Name                                       Status
    ---------                                       ------
    phys-schost-1                                   Online
    phys-schost-2                                   Online
    phys-schost-3                                   Online

    有关更多信息,请参见 clnode(1CL) 手册页。

  12. (可选的)启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled 
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      node
      …
        reboot_on_path_failure:                          enabled
      …
  13. 如果要在具有高可用性的本地文件系统上使用 Sun Cluster HA for NFS,请确保禁用回送文件系统 (loopback file system, LOFS) 。

    要禁用 LOFS,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    exclude:lofs

    /etc/system 文件所做的更改将在下次重新引导系统后生效。


    注 –

    如果在具有高可用性的本地文件系统中使用 Sun Cluster HA for NFS 并且 automountd 正在运行,则不能启用 LOFS。LOFS 会导致 Sun Cluster HA for NFS 出现切换转移问题。如果选择在具有高可用性的本地文件系统上添加 Sun Cluster HA for NFS,则必须进行以下配置更改之一。

    但是,如果要在群集中配置非全局区域,则必须在所有的群集节点上启用 LOFS。如果高可用本地文件系统上的 Sun Cluster HA for NFS 必须与 LOFS 共存,则只能放弃对 LOFS 的禁用改用他法。

    • 禁用 LOFS。

    • 禁用 automountd 守护进程。

    • 从自动安装程序映射中排除属于由 Sun Cluster HA for NFS 导出的具有高可用性的本地文件系统的所有文件。这样做可以使 LOFS 和 automountd 守护进程都保持启用状态。


    有关回送文件系统的更多信息,请参见《系统管理指南:设备和文件系统》Solaris 9Solaris 10)中的“回送文件系统”


示例 3–1 在所有节点上配置 Sun Cluster 软件

以下示例显示了记录为 scinstall 的进度消息 scinstall 如何在双节点群集 schost 上完成配置任务。群集是使用 scinstall“典型”模式从 phys-schost-1 安装的。另一个群集节点为 phys-schost-2。适配器名称为 qfe2qfe3。法定设备的自动选择已启用。


  Installation and Configuration

    Log file - /var/cluster/logs/install/scinstall.log.24747

    Testing for "/globaldevices" on "phys-schost-1" … done
    Testing for "/globaldevices" on "phys-schost-2" … done
    Checking installation status … done

    The Sun Cluster software is already installed on "phys-schost-1".
    The Sun Cluster software is already installed on "phys-schost-2".
    Starting discovery of the cluster transport configuration.

    The following connections were discovered:

        phys-schost-1:qfe2  switch1  phys-schost-2:qfe2
        phys-schost-1:qfe3  switch2  phys-schost-2:qfe3

    Completed discovery of the cluster transport configuration.

    Started sccheck on "phys-schost-1".
    Started sccheck on "phys-schost-2".

    sccheck completed with no errors or warnings for "phys-schost-1".
    sccheck completed with no errors or warnings for "phys-schost-2".

    Removing the downloaded files … done

    Configuring "phys-schost-2" … done
    Rebooting "phys-schost-2" … done

    Configuring "phys-schost-1" … done
    Rebooting "phys-schost-1" …

Log file - /var/cluster/logs/install/scinstall.log.24747

Rebooting …

故障排除

配置不成功-如果有一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Sun Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Sun Cluster 软件包。然后重新执行此过程。

接下来的操作

Procedure如何在所有节点上配置 Sun Cluster 软件 (XML)

要使用 XML 群集配置文件来配置新群集,请执行以下过程。新群集可以是某个运行 Sun Cluster 3.2 2/08 软件的现有群集的副本。

此过程将对群集中的以下组成部分进行配置:

开始之前

执行以下任务:

  1. 确保每个潜在的群集节点上均尚未配置 Sun Cluster 3.2 2/08 软件。

    1. 在要配置到新群集中的潜在节点上成为超级用户。

    2. 确定潜在节点上是否已配置了 Sun Cluster 软件。


      phys-schost# /usr/sbin/clinfo -n
      
      • 如果命令返回以下消息,请继续执行步骤 c。


        clinfo: node is not configured as part of acluster: Operation not applicable

        此消息表明潜在节点上尚未配置 Sun Cluster 软件。

      • 如果命令返回节点 ID 编号,请不要执行此过程。

        返回节点 ID 表明节点上已配置了 Sun Cluster 软件。

        如果群集上正在运行旧版本的 Sun Cluster 软件,而您希望安装 Sun Cluster 3.2 2/08 软件,请转而执行《Sun Cluster Upgrade Guide for Solaris OS》中的升级过程。

    3. 在要配置到新群集中的其余每个潜在节点上,重复执行步骤 a 和步骤 b。

      如果所有的潜在群集节点上都尚未配置 Sun Cluster 软件,请继续执行步骤 2。

  2. 如果要在新群集的专用互连中使用交换机,请确保邻居发现协议 (Neighbor Discovery Protocol, NDP) 处于禁用状态。

    请按照交换机文档中的过程来确定是否启用和禁用 NDP。

    在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包, 则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。

    建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。

  3. 如果要复制某个运行 Sun Cluster 3.2 2/08 软件的现有群集,请使用该群集中的某一节点创建一个群集配置 XML 文件。

    1. 对于要复制的群集,在该群集中的某个活动成员上成为超级用户。

    2. 将现有群集的配置信息导出到一个文件中。


      phys-schost# cluster export -o clconfigfile
      
      -o

      指定输出目标。

      clconfigfile

      群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。

      有关更多信息,请参见 cluster(1CL) 手册页。

    3. 将配置文件复制到将用来配置新群集的潜在节点上。

      您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。

  4. 在将用来配置新群集的潜在节点上成为超级用户。

  5. 根据需要修改群集配置 XML 文件。

    1. 打开群集配置 XML 文件以进行编辑。

      • 如果打算复制现有群集,请打开使用 cluster export 命令创建的文件。

      • 如果不打算复制现有群集,请创建一个新文件。

        请基于 clconfiguration(5CL) 手册页中显示的元素层次结构来编辑该文件。您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。

    2. 修改 XML 元素的值,以反映要创建的群集配置。

      • 为了能建立群集,群集配置 XML 文件中的以下组成部分必须具有有效值:

        • 群集名称

        • 群集节点

        • 群集传输

      • 系统在创建群集时会假定,配置为群集节点的每个节点上都存在着 /globaldevices 分区。全局设备名称空间将在此分区上创建。如果您需要使用其他文件系统名称来创建全局设备,则对于不具有 /globaldevices 分区的每个节点,请在其 <propertyList> 元素中添加以下属性。


        …
          <nodeList>
            <node name="node" id="N">
              <propertyList>
        …
                <property name="globaldevfs" value="/filesystem-name"/>
        …
              </propertyList>
            </node>
        …
      • 如果您正在修改从现有群集中导出的配置信息,则必须更改某些值(如节点名称)以反映新群集的情况,这些值会用于多个群集对象的定义中。

      有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。

  6. 验证群集配置 XML 文件。


    phys-schost# /usr/share/src/xmllint --valid --noout clconfigfile
    

    有关更多信息,请参见 xmllint(1) 手册页。

  7. 从包含群集配置 XML 文件的潜在节点上创建群集。


    phys-schost# cluster create -i clconfigfile
    
    -i clconfigfile

    指定要用作输入源的群集配置 XML 文件的名称。

  8. 对于 Solaris 10 OS,请在每个节点上检验服务器管理工具 (Service Management Facility, SMF) 的多用户服务是否联机。

    如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。


    phys-schost# svcs multi-user-server node
    STATE          STIME    FMRI
    online         17:52:55 svc:/milestone/multi-user-server:default
  9. 在一个节点上成为超级用户。

  10. 检验所有节点是否都已加入群集。


    phys-schost# clnode status
    

    输出类似于以下内容。


    === Cluster Nodes ===
    
    --- Node Status ---
    
    Node Name                                       Status
    ---------                                       ------
    phys-schost-1                                   Online
    phys-schost-2                                   Online
    phys-schost-3                                   Online

    有关更多信息,请参见 clnode(1CL) 手册页。

  11. 安装支持 Sun Cluster 软件必需的所有修补程序(如果尚未这样做)。

    有关修补程序的位置和安装说明,请参见《Sun Cluster 3.2 2/08 Release Notes for Solaris OS》

  12. 如果要在具有高可用性的本地文件系统上使用 Sun Cluster HA for NFS,请确保禁用回送文件系统 (loopback file system, LOFS) 。

    要禁用 LOFS,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    exclude:lofs

    /etc/system 文件所做的更改将在下次重新引导系统后生效。


    注 –

    如果在具有高可用性的本地文件系统中使用 Sun Cluster HA for NFS 并且 automountd 正在运行,则不能启用 LOFS。LOFS 会导致 Sun Cluster HA for NFS 出现切换转移问题。如果选择在具有高可用性的本地文件系统上添加 Sun Cluster HA for NFS,则必须进行以下配置更改之一。

    但是,如果要在群集中配置非全局区域,则必须在所有的群集节点上启用 LOFS。如果高可用本地文件系统上的 Sun Cluster HA for NFS 必须与 LOFS 共存,则只能放弃对 LOFS 的禁用改用他法。

    • 禁用 LOFS。

    • 禁用 automountd 守护进程。

    • 从自动安装程序映射中排除属于由 Sun Cluster HA for NFS 导出的具有高可用性的本地文件系统的所有文件。这样做可以使 LOFS 和 automountd 守护进程都保持启用状态。


    有关回送文件系统的更多信息,请参见《系统管理指南:设备和文件系统》Solaris 9Solaris 10)中的“回送文件系统”

  13. 要从现有群集中复制法定信息,请使用群集配置 XML 文件配置法定设备。

    如果创建了双节点群集,则必须配置一个法定设备。如果您选择不使用群集配置 XML 文件来创建所需的法定设备,请转至如何配置法定设备

    1. 如果要将法定服务器用作法定设备,请确保法定服务器已经过设置并且正在运行。

      按照如何安装和配置 Quorum Server 软件中的说明操作。

    2. 如果要将 NAS 设备用作法定设备,请确保 NAS 设备已经过设置并且正在运行。

      1. 请遵循将 NAS 设备用作法定设备方面的相关要求。

        请参见《Sun Cluster 3.1 - 3.2 With Network-Attached Storage Devices Manual for Solaris OS》

      2. 请按照设备文档中的说明来设置 NAS 设备。

    3. 确保群集配置 XML 文件中的法定配置信息反映的是所创建群集的有效值。

    4. 如果对群集配置 XML 文件进行过更改,请验证该文件。


      phys-schost# xmllint --valid --noout clconfigfile
      
    5. 配置法定设备。


      phys-schost# clquorum add -i clconfigfile devicename
      
      devicename

      指定要配置为法定设备的设备的名称。

  14. 使群集脱离安装模式。


    phys-schost# clquorum reset
    
  15. 停止未配置群集成员的计算机对群集配置的访问。


    phys-schost# claccess deny-all
    
  16. (可选的)启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled 
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      node
      …
        reboot_on_path_failure:                          enabled
      …

示例 3–2 使用 XML 文件在所有节点上配置 Sun Cluster 软件

以下示例将一个现有双节点群集的群集配置和法定配置复制到了一个新的双节点群集中。新群集安装了 Solaris 10 OS,并且未配置非全局区域。群集配置将从现有群集节点 phys-oldhost-1 导出到群集配置 XML 文件 clusterconf.xml 中。新群集的节点名称为 phys-newhost-1phys-newhost-2。新群集中被配置为法定设备的设备是 d3

此示例中的提示符名称 phys-newhost-N 表示应在两个群集节点上执行相应的命令。


phys-newhost-N# /usr/sbin/clinfo -n
clinfo: node is not configured as part of acluster: Operation not applicable
 
phys-oldhost-1# cluster export -o clusterconf.xml
Copy clusterconf.xml to phys-newhost-1 and modify the file with valid values
 
phys-newhost-1# xmllint --valid --noout clusterconf.xml
No errors are reported
 
phys-newhost-1# cluster create -i clusterconf.xml
phys-newhost-N# svcs multi-user-server phys-newhost-N
STATE          STIME    FMRI
online         17:52:55 svc:/milestone/multi-user-server:default
phys-newhost-1# clnode status
Output shows that both nodes are online
 
phys-newhost-1# clquorum add -i clusterconf.xml d3
phys-newhost-1# clquorum reset

故障排除

配置不成功-如果有一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Sun Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Sun Cluster 软件包。然后重新执行此过程。

接下来的操作

转至如何检验定额配置和安装模式

另请参见

完全建立了群集之后,您可以从现有群集中复制其他群集组成部分的配置。如果尚未这样做,请修改要复制的 XML 元素的值,以反映要将组成部分添加到其中的群集配置。例如,如果要复制资源组,请确保 <resourcegroupNodeList> 条目包含的是对新群集而言有效的节点名称,而不是所复制群集中的节点名称,除非它们与新群集中的节点名称相同。

要复制群集组成部分,请对要复制的群集组成部分运行面向对象命令的 export 子命令。有关面向对象命令的语法和选项的更多信息,请参见要复制的群集对象所对应的手册页。下表列出了在建立群集之后可以通过群集配置 XML 文件创建的群集组成部分,以及用来复制各组成部分的命令所对应的手册页。


注 –

此表提供了各个 Sun Cluster 命令的完整形式。此外,大多数命令还有简短格式。除了命令名称的形式以外,简写形式和完整形式的命令是相同的。有关各命令及其简写形式的列表,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的附录 A “Sun Cluster 面向对象的命令”


群集组成部分 

手册页 

特殊说明 

设备组:Solaris Volume Manager 和 VERITAS 卷管理器 

cldevicegroup(1CL)

对于 Solaris Volume Manager,应首先创建您在群集配置 XML 文件中指定的磁盘集。 

对于 VxVM,应首先安装并配置 VxVM 软件,然后再创建您在群集配置 XML 文件中指定的磁盘组。 

资源 

clresource(1CL)

使用 clresourceclressharedaddressclreslogicalhostname 命令的 -a 选项可以在复制资源的同时复制与之相关联的资源类型和资源组。

如果不使用该选项,则在添加资源之前必须先将其资源类型和资源组添加到群集中。 

共享地址资源 

clressharedaddress(1CL)

逻辑主机名资源 

clreslogicalhostname(1CL)

资源类型 

clresourcetype(1CL)

资源组 

clresourcegroup(1CL)

NAS 设备 

clnasdevice(1CL)

必须首先按照 NAS 设备文档中的介绍设置此类设备。 

SNMP 主机 

clsnmphost(1CL)

clsnmphost create -i 命令要求您用 -f 选项指定用户密码文件。

SNMP 用户 

clsnmpuser(1CL)

 

监视用于群集对象的系统资源时所使用的阈值 

cltelemetryattribute(1CL)

 

Procedure如何安装 Solaris 和 Sun Cluster 软件 (JumpStart)

此过程介绍了如何设置和使用 scinstall(1M) 自定义 JumpStart 安装方法。此方法可将 Solaris OS 和 Sun Cluster 软件安装在所有群集节点上,并建立群集。您也可以使用此过程向现有的群集添加新节点。

开始之前

执行以下任务:

按照以下指导信息在此过程中使用交互式的 scinstall 实用程序:

  1. 设置 JumpStart 安装服务器。

    确保 JumpStart 安装服务器符合下列要求。

    • 安装服务器位于群集节点所在的子网中,或者位于群集节点使用的子网对应的 Solaris 引导服务器上。

    • 安装服务器本身不是群集节点。

    • 安装服务器将安装 Sun Cluster 软件支持的某个 Solaris OS 发行版本。

    • 有一个定制 JumpStart 目录可用于 Sun Cluster 软件的 JumpStart 安装。此 jumpstart-dir 目录必须符合下列要求:

      • 包含 check 实用程序的副本。

      • 是为了供 JumpStart 安装服务器读取而导出的 NFS。

    • 每个新的群集节点都配置为一个自定义的 JumpStart 安装客户机,该客户机使用为 Sun Cluster 安装设置的自定义 JumpStart 目录。

    按照与您的软件平台和 OS 版本相应的说明来设置 JumpStart 安装服务器。请参见《Solaris 9 9/04 Installation Guide》中的“Creating a Profile Server for Networked Systems”《Solaris 10 8/07 Installation Guide: Custom JumpStart and Advanced Installations》中的“Creating a Profile Server for Networked Systems”

    另请参见 setup_install_server(1M) 手册页和 add_install_client(1M) 手册页。

  2. 如果要将新节点安装到现有的群集,请将该节点添加到授权的群集节点列表中。

    1. 切换到另一个活动的群集节点,并启动 clsetup 实用程序。

    2. 使用 clsetup 实用程序将新节点的名称添加到授权群集节点列表中。

    有关更多信息,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的“如何将节点添加到授权的节点列表中”

  3. 在群集节点或运行相同服务器平台的另一台计算机上,安装 Solaris OS 和所有必要的修补程序(如果尚未这样做)。

    如果服务器上已安装了 Solaris 软件,必须确保 Solaris 安装符合 Sun Cluster 软件和任何其他要在群集中安装的软件的要求。有关安装符合 Sun Cluster 软件要求的 Solaris 软件的更多信息,请参见如何安装 Solaris 软件

    请按照如何安装 Solaris 软件中的过程操作。

  4. 在已安装的系统上,安装 Sun Cluster 软件和所有必要的修补程序(如果尚未这样做)。

    请按照如何安装 Sun Cluster 框架和数据服务软件包中的过程操作。

    有关修补程序的位置和安装说明,请参见《Sun Cluster 3.2 2/08 Release Notes for Solaris OS》

  5. 启用公共代理容器守护进程,使其在系统引导期间自动启动。


    machine# cacaoadm enable
    
  6. 在已安装的系统上,使用群集中所用的所有公共 IP 地址更新 /etc/inet/ipnodes 文件。

    执行此步骤,无论是否正在使用命名服务。有关必须添加其 IP 地址的 Sun Cluster 组件的列表,请参见公共网络 IP 地址

  7. 创建已安装系统的 Flash 归档文件。


    machine# flarcreate -n name archive
    
    -n name

    为 Flash 归档文件指定的名称。

    archive

    为 Flash 归档文件指定的文件名,带有完整路径。根据约定,文件名以 .flar 结尾。

    按照以下一本手册中的过程执行操作:

  8. 确保 Flash 归档文件是为了供 JumpStart 安装服务器读取而导出的 NFS。

    有关自动共享文件的更多信息,请参见《系统管理指南:网络服务》Solaris 9Solaris 10)中的“管理网络文件系统(概述)”

    另请参见 share(1M) 手册页和 dfstab(4) 手册页。

  9. 在 JumpStart 安装服务器上成为超级用户。

  10. 从 JumpStart 安装服务器启动 scinstall(1M) 实用程序。

    此例中假定您创建的 JumpStart 安装目录路径为 /export/suncluster/sc31/。在介质路径中,请将 arch 替换为 sparcx86(仅限于 Solaris 10),将 ver 替换为 9(对于 Solaris 9)或 10(对于 Solaris 10)。


    installserver# cd /export/suncluster/sc31/Solaris_arch/Product/sun_cluster/ \
    Solaris_ver/Tools/
    installserver# ./scinstall
    

    将显示 scinstall 的主菜单。

  11. 键入 "Configure a Cluster to be JumpStarted From This Install Server" 所对应的选项号并按回车键。

    此选项用于配置定制 JumpStart 的结束脚本。JumpStart 使用这些结束脚本来安装 Sun Cluster 软件。


     *** Main Menu ***
     
        Please select from one of the following (*) options:
    
          * 1) Create a new cluster or add a cluster node
          * 2) Configure a cluster to be JumpStarted from this install server
            3) Manage a dual-partition upgrade
            4) Upgrade this cluster node
          * 5) Print release information for this cluster node 
    
          * ?) Help with menu options
          * q) Quit
     
        Option:  2
    
  12. 按照菜单提示给出您的答案,所做回答应依据于您在配置规划工作单中填写的内容。

    scinstall 命令可存储您的配置信息,并将默认的 class 文件 autoscinstall.class 复制到 /jumpstart-dir/autoscinstall.d/3.2/ 目录下。此文件类似于以下示例。


    install_type    initial_install
    system_type     standalone
    partitioning    explicit
    filesys         rootdisk.s0 free /
    filesys         rootdisk.s1 750  swap
    filesys         rootdisk.s3 512  /globaldevices
    filesys         rootdisk.s7 20
    cluster         SUNWCuser        add
    package         SUNWman          add
  13. 如有必要,请通过修改 autoscinstall.class 文件来配置 JumpStart,以便安装 Flash 归档文件。

    1. 根据需要修改条目,使其符合您在 Flash 归档计算机上安装 Solaris OS 时或运行 scinstall 实用程序时所做的配置选择。

      例如,如果为全局设备文件系统指定分片 4 并为 scinstall 指定文件系统名称为 /gdevs,则需要将 autoscinstall.class 文件的 /globaldevices 条目更改为:


      filesys         rootdisk.s4 512  /gdevs
    2. 更改 autoscinstall.class 文件中的以下条目。

      要替换的现有条目 

      要添加的新条目 

      install_type

      initial_install

      install_type

      flash_install

      system_type

      standalone

      archive_location

      retrieval_type location

      有关 retrieval_typelocationarchive_location 关键字一起使用时的有效值信息,请参见《Solaris 9 9/04 安装指南》《Solaris 10 安装指南:自定义 JumpStart 和高级安装》中的archive_location 关键字”

    3. 删除将安装特定软件包的所有条目,例如以下条目。


      cluster         SUNWCuser        add
      package         SUNWman          add
    4. 如果配置中带有其他 Solaris 软件要求,请相应地更改 autoscinstall.class 文件。

      autoscinstall.class 文件将安装最终用户 Solaris 软件组 (SUNWCuser)。

    5. 如果安装最终用户 Solaris 软件组 (SUNWCuser),请将可能需要的所有附加 Solaris 软件包添加到 autoscinstall.class 文件中。

      下表列出了支持某些 Sun Cluster 功能所需的 Solaris 软件包。最终用户 Solaris 软件组中不包含这些软件包。有关更多信息,请参见Solaris 软件组注意事项

      特性 

      必需的 Solaris 软件包 

      RSMAPI、RSMRDT 驱动程序或 SCI-PCI 适配器(仅基于 SPARC 的群集) 

      SPARC:Solaris 9SUNWrsm SUNWrsmx SUNWrsmo SUNWrsmox

      Solaris 10SUNWrsm SUNWrsmo

      Sun Cluster Manager(原名 SunPlexTM Manager)

      SUNWapchr SUNWapchu

    您可以用以下方法之一更改缺省的 class 文件:

    • 直接编辑 autoscinstall.class 文件。这些更改应用于使用该定制的 JumpStart 目录的所有群集中的所有节点。

    • 更新 rules 文件使其指向其他配置文件,然后运行 check 实用程序来验证 rules 文件。

    只要 Solaris 操作系统的安装配置文件符合 Sun Cluster 文件系统的最低分配要求,Sun Cluster 软件便不会限制对安装配置文件的其他更改。有关为了支持 Sun Cluster 软件而应遵循的分区指导信息和要求,请参见系统磁盘分区

    有关 JumpStart 配置文件的更多信息,请参见《Solaris 9 9/04 Installation Guide》中的第 26  章 “Preparing Custom JumpStart Installations (Tasks)”《Solaris 10 8/07 Installation Guide: Custom JumpStart and Advanced Installations》中的第 3  章 “Preparing Custom JumpStart Installations (Tasks)”

  14. 要安装以下各功能部件所需的软件包或执行其他安装后任务,请设置您自己的结束脚本。

    • 远程共享内存应用程序编程接口 (RSMAPI)

    • 用于互连传输的 SCI-PCI 适配器

    • RSMRDT 驱动程序


    注 –

    RSMRDT 驱动程序只能在运行已启用 RSM 的 Oracle9i 版本 2 SCI 配置的群集中使用。有关详细的安装和配置说明,请参阅 Oracle9i 版本 2 的用户文档。


    您的结束脚本在由 scinstall 命令安装的标准结束脚本之后运行。有关创建 JumpStart 结束脚本的信息,请参见《Solaris 9 9/04 Installation Guide》中的第 26  章 “Preparing Custom JumpStart Installations (Tasks)”《Solaris 10 8/07 Installation Guide: Custom JumpStart and Advanced Installations》中的第 3  章 “Preparing Custom JumpStart Installations (Tasks)”

    1. 确保将使用缺省的 class 文件来安装所有相关的 Solaris 软件包。

      请参见步骤 13

    2. 将结束脚本命名为 finish

    3. 修改 finish 脚本以安装下表中列出的软件包,这些软件包用于支持要使用的功能。

      特性 

      要安装的附加 Sun Cluster 3.2 2/08 软件包 

      RSMAPI 

      SUNWscrif

      SCI-PCI 适配器 

      • Solaris 9SUNWsci SUNWscid SUNWscidx

      • Solaris 10SUNWscir SUNWsci SUNWscidr SUNWscid

      RSMRDT 驱动程序 

      SUNWscrdt

      • 按照表中所用顺序安装软件包。

      • 安装 Solaris_arch/Product/sun_cluster/Solaris_ver/Packages/ 目录,其中,archsparcx86(仅适用于 Solaris 10),而 ver9(对于 Solaris 9)或 10(对于 Solaris 10) 中的软件包。

    4. 对希望 finish 脚本执行的其他安装后任务进行其他修改。

    5. finish 脚本复制到每个 jumpstart-dir/autoscinstall.d/nodes/node 目录中。

      为群集中的每个节点创建一个 node 目录。或者,使用此命名约定来创建指向共享 finish 脚本的符号链接。

  15. 从 JumpStart 安装服务器退出。

  16. 如果要在新群集的专用互连中使用交换机,请确保邻居发现协议 (Neighbor Discovery Protocol, NDP) 处于禁用状态。

    请按照交换机文档中的过程来确定是否启用和禁用 NDP。

    在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包, 则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。

    建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。

  17. 如果正在使用群集管理控制台,则为群集中的每个节点显示一个控制台屏幕。

    • 如果管理控制台上已安装并配置了群集控制面板 (Cluster Control Panel, CCP) 软件,请使用 cconsole(1M) 实用程序来显示各个控制台屏幕。

      以超级用户的身份使用以下命令启动 cconsole 实用程序:


      adminconsole# /opt/SUNWcluster/bin/cconsole clustername &
      

      cconsole 实用程序还将打开一个主窗口,您可以从该主窗口同时将输入发送到所有单个控制台窗口。

    • 如果未使用 cconsole 实用程序,请单独连接每个节点的控制台。

  18. 关闭各个节点。


    phys-schost# shutdown -g0 -y -i0
    
  19. 引导各节点以启动 JumpStart 安装。

    • 在基于 SPARC 的系统中执行以下操作:


      ok boot net - install
      

      注 –

      命令中破折号 (-) 的两端需加空格。


    • 在基于 x86 的系统中执行以下操作:

      1. 按任意键开始引导序列。


        Press any key to reboot.
        keystroke
        
      2. BIOS 信息屏幕一出现,就立即按 Esc+2 组合键或 F2 键。

        初始序列完成后,将出现 BIOS 设置实用程序屏幕。

      3. 在 BIOS 设置实用程序的菜单栏中,导航至“引导”菜单项。

        将显示引导设备列表。

      4. 导航至列表中与 JumpStart PXE 安装服务器连接到同一网络的 IBA,然后将其移到引导顺序的顶部。

        IBA 引导选项右侧的最低的编号对应较低的以太网端口号。IBA 引导选项右侧的较高的编号对应较高的以太网端口号。

      5. 保存所做的更改并退出 BIOS。

        引导序列将再次开始执行。进一步处理之后,屏幕上将显示 GRUB 菜单。

      6. 立即选择 Solaris JumpStart 条目,然后按 Enter 键。


        注 –

        如果 Solaris JumpStart 条目是列出的唯一条目,则也可以等待选择屏幕超时。如果您在 30 秒内不做出响应,系统将自动继续执行引导序列。



        GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
        +-------------------------------------------------------------------------+
        | Solaris_10 Jumpstart                                                    |
        |                                                                         |
        |                                                                         |
        +-------------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press enter to boot the selected OS, 'e' to edit the
        commands before booting, or 'c' for a command-line.

        进一步处理之后,屏幕上将显示安装类型菜单。

      7. 在安装类型菜单中,立即键入“定制 JumpStart”对应的菜单编号。


        注 –

        如果在 30–秒超时时限到达之前没有键入“定制 JumpStart”对应的编号,系统将自动开始进行 Solaris 交互式安装。



              Select the type of installation you want to perform:
        
                 1 Solaris Interactive
                 2 Custom JumpStart
                 3 Solaris Interactive Text (Desktop session)
                 4 Solaris Interactive Text (Console session)
                 5 Apply driver updates
                 6 Single user shell
        
                 Enter the number of your choice.
        2
        

        JumpStart 将在每个节点上安装 Solaris 操作系统和 Sun Cluster 软件。当安装成功完成时,每个节点被完全安装为一个新的群集节点。安装 Sun Cluster 的输出信息记录在 /var/cluster/logs/install/scinstall.log. N 文件中。

      8. 当 BIOS 屏幕再次出现时,立即按 Esc+2 组合键或 F2 键。


        注 –

        如果此时不中断 BIOS,它将自动返回到安装类型菜单。如果 30 秒内不在该菜单中键入任何选项,系统将自动开始进行交互式安装。


        进一步处理之后,将显示 BIOS 设置实用程序。

      9. 在菜单栏中导航至“引导”菜单。

        将显示引导设备列表。

      10. 导航至“硬盘驱动器”条目并将其重新移至引导顺序的顶部。

      11. 保存所做的更改并退出 BIOS。

        引导序列将再次开始执行。无需在 GRUB 菜单中执行任何进一步的交互操作,即可完成引导至群集模式中的过程。

  20. 对于 Solaris 10 OS,请在每个节点上检验服务器管理工具 (Service Management Facility, SMF) 的多用户服务是否联机。

    如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。


    phys-schost# svcs multi-user-server node
    STATE          STIME    FMRI
    online         17:52:55 svc:/milestone/multi-user-server:default
  21. 如果要将新节点安装到现有的群集,请在新节点上为所有现有群集文件系统创建挂载点。

    1. 从群集的另一个活动节点上,显示所有群集文件系统的名称。


      phys-schost# mount | grep global | egrep -v node@ | awk '{print $1}'
      
    2. 在添加到群集的节点上,为群集中的每个群集文件系统创建挂载点。


      phys-schost-new# mkdir -p mountpoint
      

      例如,如果由安装命令返回的文件系统名称为 /global/dg-schost-1,请在正被添加到群集中的节点上运行 mkdir -p /global/dg-schost-1


      注 –

      当您在步骤 25 中重新引导群集之后,这些挂载点将成为活动挂载点。


    3. 如果群集中的任何节点上安装了 VERITAS 卷管理器 (VxVM),请在已安装 VxVM 的每个节点上查看 vxio 编号。


      phys-schost# grep vxio /etc/name_to_major
      vxio NNN
      
      • 确保在安装了 VxVM 的每个节点上都使用相同的 vxio 编号。

      • 确保 vxio 编号在每个未安装 VxVM 的节点上都可用。

      • 如果未安装 VxVM 的节点上已经使用了 vxio 编号,请在该节点上释放此编号。更改 /etc/name_to_major 条目以使用其它编号。

  22. (可选的)要在 Sun Enterprise 10000 服务器上使用动态重新配置,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    set kernel_cage_enable=1

    此条目在下次重新引导系统后生效。有关执行 Sun Cluster 配置中的动态重新配置任务的过程,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》。有关动态重新配置的更多信息,请参见服务器文档。

  23. 如果要在具有高可用性的本地文件系统上使用 Sun Cluster HA for NFS,请确保禁用回送文件系统 (loopback file system, LOFS) 。

    要禁用 LOFS,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    exclude:lofs

    /etc/system 文件所做的更改将在下次重新引导系统后生效。


    注 –

    如果在具有高可用性的本地文件系统中使用 Sun Cluster HA for NFS 并且 automountd 正在运行,则不能启用 LOFS。LOFS 会导致 Sun Cluster HA for NFS 出现切换转移问题。如果选择在具有高可用性的本地文件系统上添加 Sun Cluster HA for NFS,则必须进行以下配置更改之一。

    但是,如果要在群集中配置非全局区域,则必须在所有的群集节点上启用 LOFS。如果高可用本地文件系统上的 Sun Cluster HA for NFS 必须与 LOFS 共存,则只能放弃对 LOFS 的禁用改用他法。

    • 禁用 LOFS。

    • 禁用 automountd 守护进程。

    • 从自动安装程序映射中排除属于由 Sun Cluster HA for NFS 导出的具有高可用性的本地文件系统的所有文件。这样做可以使 LOFS 和 automountd 守护进程都保持启用状态。


    有关回送文件系统的更多信息,请参见《系统管理指南:设备和文件系统》Solaris 9Solaris 10)中的“回送文件系统”

  24. x86: 设置默认的引导文件。

    如果无法访问登录提示,该值的设置使您能够重新引导节点。

    • 在 Solaris 9 OS 上,将默认值设置为 kadb


      phys-schost# eeprom boot-file=kadb
      
    • 在 Solaris 10 OS 上,在 GRUB 引导参数菜单中将默认值设置为 kmdb


      grub edit> kernel /platform/i86pc/multiboot kmdb
      
  25. 如果执行需要重新引导群集的任务,请按照以下步骤重新引导群集。

    以下是一些需要重新引导的任务:

    • 向现有群集中添加新节点

    • 安装需要重新引导节点或群集的修补程序

    • 对配置进行需要重新引导以便激活的更改

    1. 在一个节点上成为超级用户。

    2. 关闭群集。


      phys-schost-1# cluster shutdown -y -g0 clustername
      

      注 –

      只能等到群集关闭之后才能重新引导群集中第一个安装的节点。禁用群集安装模式前,只有建立群集的第一个安装节点才有定额选票。在建立的仍处于安装模式的群集中,如果在重新引导第一个安装的节点前未关闭群集,其余群集节点将无法获得定额选票。然后整个群集将关闭。

      群集节点会一直处在安装模式下,直到您首次运行 clsetup 命令为止。将在执行如何配置法定设备过程期间运行此命令。


    3. 重新引导群集中的每个节点。

      • 在基于 SPARC 的系统中执行以下操作:


        ok boot
        
      • 在基于 x86 的系统中执行以下操作:

        显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


        GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
        +-------------------------------------------------------------------------+
        | Solaris 10 /sol_10_x86                                                  |
        | Solaris failsafe                                                        |
        |                                                                         |
        +-------------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press enter to boot the selected OS, 'e' to edit the
        commands before booting, or 'c' for a command-line.

        有关基于 GRUB 进行引导的更多信息,请参见《System Administration Guide: Basic Administration》中的第 11  章 “GRUB Based Booting (Tasks)”

    scinstall 实用程序用于安装和配置所有群集节点并重新引导群集。将所有节点成功引导到群集中之后,即建立了群集。安装 Sun Cluster 的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。

  26. (可选的)如果没有执行步骤 25 来重新引导节点,请在每个节点上手动启动 Sun Java Web Console Web 服务器。


    phys-schost# smcwebserver start
    

    有关更多信息,请参见 smcwebserver(1M) 手册页。

  27. 在一个节点上成为超级用户。

  28. 检验所有节点是否都已加入群集。


    phys-schost# clnode status
    

    输出类似于以下内容。


    === Cluster Nodes ===
    
    --- Node Status ---
    
    Node Name                                       Status
    ---------                                       ------
    phys-schost-1                                   Online
    phys-schost-2                                   Online
    phys-schost-3                                   Online

    有关更多信息,请参见 clnode(1CL) 手册页。

  29. (可选的)在每个节点上,启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled 
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      node
      …
        reboot_on_path_failure:                          enabled
      …
接下来的操作

如果向双节点群集中添加了节点,请转至如何在向群集中添加节点后更新法定设备

否则,转至下一个相应过程:

故障排除

禁用的 scinstall 选项-如果 scinstall 命令中 JumpStart 选项的开头没有星号,则表示该选项被禁用。这种状况表明 JumpStart 安装未完成或安装出错。要解决这种情况,请先退出 scinstall 实用程序。重复执行步骤 1步骤 14 以更正 JumpStart 设置,然后重新启动 scinstall 实用程序。

关于不存在节点的错误消息-除非安装了您自己的 /etc/inet/ntp.conf 文件,否则 scinstall 命令将安装默认的 ntp.conf 文件。默认文件包含在最大数量的节点的参考中。因此,xntpd(1M) 守护进程可能会在引导时发出关于某些参考的错误消息。可以忽略这些消息。有关如何在其他群集条件都正常的情况下抑制这些消息的信息,请参见如何配置网络时间协议 (NTP)

Procedure如何在添加群集节点之前做好群集准备工作

要在添加新群集节点之前做好群集准备工作,请对现有的群集节点执行以下过程。

开始之前

执行以下任务:

  1. 如果要使用 Cluster Control Panel (CCP),请更新管理控制台上的配置文件。

    1. 将要添加节点的名称添加到 /etc/clusters 文件的群集条目中。

    2. /etc/serialports 文件中添加一个条目,条目中应包含新节点的名称、节点的控制台访问设备的主机名以及端口号。

  2. 将新节点的名称添加到群集的授权节点列表中。

    1. 在任一节点上成为超级用户。

    2. 启动 clsetup 实用程序。


      phys-schost# clsetup
      

      显示“Main Menu”。

    3. 选择菜单项 "New nodes"。

    4. 选择菜单项 "Specify the name of a machine which may add itself"。

    5. 按照提示操作,将节点名称添加到验证过的机器列表中。

      如果任务已完成而没有出现错误,则 clsetup 实用程序将显示 Command completed successfully 消息。

    6. 退出 clsetup 实用程序。

  3. 如果要向单节点群集中添加节点,请通过显示互连配置确保已存在两个群集互连。


    phys-schost# clinterconnect show
    

    添加节点之前,必须具有已配置的至少两条电缆或两个适配器。

    • 如果输出中显示了两根电缆或两个适配器的配置信息,请继续执行步骤 4

    • 如果输出中未显示任何电缆或适配器的配置信息,或只显示了一条电缆或一个适配器的配置信息,请配置新的群集互连。

      1. 在一个节点上启动 clsetup 实用程序。


        phys-schost# clsetup
        
      2. 选择菜单项“群集互连”。

      3. 选择菜单项“添加传输电缆”。

        按照说明指定要添加到群集中的节点的名称、传输适配器的名称以及是否使用传输交换机。

      4. 如果需要,请重复执行步骤 c 以配置其他群集互连。

      5. 完成后,退出 clsetup 实用程序。

      6. 验证群集现在是否已配置两个群集互连。


        phys-schost# clinterconnect show
        

        命令输出结果应该显示至少两个群集互连的配置信息。

  4. 确保专用网络配置可支持要添加的节点和专用网络。

    1. 显示当前专用网络配置所支持的最大节点数和最大专用网络数。


      phys-schost# cluster show-netprops
      

      输出结果如下,其中显示了默认值:


      === Private Network ===                        
      
      private_netaddr:                                172.16.0.0
        private_netmask:                                255.255.248.0
        max_nodes:                                      64
        max_privatenets:                                10
    2. 确定当前的专用网络配置能否支持增加的节点数(包括非全局区域数)和专用网络数。

接下来的操作

在新群集节点上配置 Sun Cluster 软件。请转至如何在附加群集节点上配置 Sun Cluster 软件 (scinstall)如何在新增的群集节点上配置 Sun Cluster 软件 (XML)

Procedure如何在添加节点或专用网络时更改专用网络配置

要更改群集的专用 IP 地址范围以容纳增加的节点或非全局区域的数量、增加的专用网络数量或者它们同时增加的数量,请执行以下任务。此过程也可以用来缩小专用 IP 地址范围。


注 –

此过程要求关闭整个群集。


开始之前

请确保为所有群集节点启用了 超级用户的远程 shell (rsh(1M)) 或安全 shell (ssh(1)) 访问权限。

  1. 成为群集中一个节点上的超级用户。

  2. 从一个节点上启动 clsetup 实用程序。


    # clsetup
    

    屏幕上将显示 clsetup 主菜单。

  3. 使每个资源组脱机。

    如果节点包含非全局区域,还应将这些区域内的所有资源组切换到脱机状态下。

    1. 键入与“资源组”选项对应的编号,然后按 Return 键。

      将显示“资源组”菜单。

    2. 键入与“使资源组处于联机/脱机状况或在两种状态间切换”选项对应的编号,然后按 Return 键。

    3. 按照提示使所有资源组脱机并将其置于不受管理状态。

    4. 所有资源组都脱机后,键入 q 返回到“资源组”菜单。

  4. 禁用群集中的所有资源。

    1. 键入与“启用/禁用资源”选项对应的编号,然后按 Return 键。

    2. 选择要禁用的资源,然后按照提示进行操作。

    3. 对每个要禁用的资源重复执行上一步骤。

    4. 所有资源都禁用后,键入 q 返回到“资源组”菜单。

  5. 退出 clsetup 实用程序。

  6. 检验所有节点上的所有资源是否都处于脱机状态,所有资源组是否都处于不受管理状态。


    # cluster status -t resource,resourcegroup
    
    -t

    限定为仅输出指定的群集对象

    resource

    指定资源

    resourcegroup

    指定资源组

  7. 从一个节点,关闭群集。


    # cluster shutdown -g0 -y
    
    -g

    指定等待时间(以秒为单位)

    -y

    禁止发出用于询问您是否确认要关闭的提示

  8. 将各个节点都引导成非群集模式。

    • 在基于 SPARC 的系统中,执行以下命令:


      ok boot -x
      
    • 在基于 x86 的系统中,执行以下命令:

      1. 在 GRUB 菜单中,使用方向键选择适当的 Solaris 条目,然后键入 e 编辑其命令。

        GRUB 菜单显示如下内容:


        GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
        +----------------------------------------------------------------------+
        | Solaris 10 /sol_10_x86                                               |
        | Solaris failsafe                                                     |
        |                                                                      |
        +----------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press enter to boot the selected OS, 'e' to edit the
        commands before booting, or 'c' for a command-line.

        有关基于 GRUB 进行引导的更多信息,请参见《System Administration Guide: Basic Administration》中的第 11  章 “GRUB Based Booting (Tasks)”

      2. 在引导参数屏幕中,使用方向键选择 kernel 条目,然后键入 e 编辑该条目。

        GRUB 引导参数屏幕的显示与以下内容类似:


        GNU GRUB version 0.95 (615K lower / 2095552K upper memory)
        +----------------------------------------------------------------------+
        | root (hd0,0,a)                                                       |
        | kernel /platform/i86pc/multiboot                                     |
        | module /platform/i86pc/boot_archive                                  |
        +----------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press 'b' to boot, 'e' to edit the selected command in the
        boot sequence, 'c' for a command-line, 'o' to open a new line
        after ('O' for before) the selected line, 'd' to remove the
        selected line, or escape to go back to the main menu.
      3. 在命令中添加 -x 以指定将系统引导至非群集模式。


        [ Minimal BASH-like line editing is supported. For the first word, TAB
        lists possible command completions. Anywhere else TAB lists the possible
        completions of a device/filename. ESC at any time exits. ]
        
        grub edit> kernel /platform/i86pc/multiboot -x
        
      4. 按 Enter 键接受更改,并返回到引导参数屏幕。

        屏幕将显示编辑后的命令。


        GNU GRUB version 0.95 (615K lower / 2095552K upper memory)
        +----------------------------------------------------------------------+
        | root (hd0,0,a)                                                       |
        | kernel /platform/i86pc/multiboot -x                                  |
        | module /platform/i86pc/boot_archive                                  |
        +----------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press 'b' to boot, 'e' to edit the selected command in the
        boot sequence, 'c' for a command-line, 'o' to open a new line
        after ('O' for before) the selected line, 'd' to remove the
        selected line, or escape to go back to the main menu.-
      5. 键入 b 将节点引导至非群集模式。


        注 –

        对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请再次执行上述步骤,将 -x 选项添加到内核引导参数命令中。


  9. 从一个节点启动 clsetup 实用程序。

    在非群集模式下运行时,clsetup 实用程序会为非群集模式操作显示“主菜单”。

  10. 键入 "Change IP Address Range" 选项对应的编号,然后按 Return 键。

    clsetup 实用程序显示当前专用网络配置,然后询问您是否要更改此配置。

  11. 要更改专用网络 IP 地址或 IP 地址范围,请键入 yes,然后按 Return 键。

    clsetup 实用程序将显示默认专用网络 IP 地址 172.16.0.0,并询问您是否接受此默认值。

  12. 更改或接受此专用网络 IP 地址。

    • 要接受默认专用网络 IP 地址并进行 IP 地址范围更改,请键入 yes,然后按 Return 键。

      clsetup 实用程序将询问您是否接受默认网络掩码。请跳到下一步输入您的响应。

    • 要更改默认专用网络 IP 地址,请执行以下子步骤。

      1. 对于 clsetup 实用程序询问的是否接受默认地址的问题,键入 no 作为响应,然后按 Return 键。

        clsetup 实用程序将提示您输入新的专用网络 IP 地址。

      2. 键入新的 IP 地址,然后按 Return 键。

        clsetup 实用程序显示默认网络掩码,然后询问您是否接受该默认网络掩码。

  13. 更改或接受默认专用网络 IP 地址范围。

    默认网络掩码为 255.255.248.0。此默认 IP 地址范围支持在群集中包含最多 64 个节点和最多 10 个专用网络。

    • 要接受该默认 IP 地址范围,请键入 yes,然后按 Return 键。

      然后跳到下一步。

    • 要更改该 IP 地址范围,请执行以下子步骤。

      1. 对于 clsetup 实用程序询问的是否接受默认地址范围的问题,键入 no 作为响应,然后按 Return 键。

        如果您拒绝默认网络掩码,clsetup 实用程序将提示您输入期望在群集中配置的节点数目和专用网络数目。

      2. 输入您期望在群集中配置的节点数目和专用网络数目。

        clsetup 实用程序将根据这些数值计算出两个网络掩码供选择:

        • 第一个网络掩码是支持指定节点数目和专用网络数目的最小网络掩码。

        • 第二个网络掩码可支持两倍于指定值的节点数目和专用网络数目,从而适应未来可能出现的增长情况。

      3. 指定上述任一网络掩码,或另外指定一个可支持预期节点数目和专用网络数目的网络掩码。

  14. 对于 clsetup 实用程序询问的是否继续进行更新的问题,键入 yes 作为响应。

  15. 完成后,退出 clsetup 实用程序。

  16. 将每个节点重新引导回群集模式。

    1. 关闭各个节点。


      # shutdown -g0 -y
      
    2. 将每个节点都引导到群集模式下。

      • 在基于 SPARC 的系统中执行以下操作:


        ok boot
        
      • 在基于 x86 的系统中执行以下操作:

        显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


        GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
        +-------------------------------------------------------------------------+
        | Solaris 10 /sol_10_x86                                                  |
        | Solaris failsafe                                                        |
        |                                                                         |
        +-------------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press enter to boot the selected OS, 'e' to edit the
        commands before booting, or 'c' for a command-line.

        有关基于 GRUB 进行引导的更多信息,请参见《System Administration Guide: Basic Administration》中的第 11  章 “GRUB Based Booting (Tasks)”

  17. 从一个节点启动 clsetup 实用程序。


    # clsetup
    

    屏幕上将显示 clsetup 主菜单。

  18. 重新启用所有禁用的资源。

    1. 键入与“资源组”选项对应的编号,然后按 Return 键。

      将显示“资源组”菜单。

    2. 键入与“启用/禁用资源”选项对应的编号,然后按 Return 键。

    3. 选择要启用的资源,然后按照提示操作。

    4. 对每个禁用的资源重复上述步骤。

    5. 所有资源都重新启用之后,键入 q 返回到“资源组”菜单。

  19. 使每个资源组重新联机。

    如果节点包含非全局区域,还应使这些区域内的所有资源组联机。

    1. 键入与“使资源组处于联机/脱机状况或在两种状态间切换”选项对应的编号,然后按 Return 键。

    2. 按照提示将各个资源组置入被管理状态,然后使资源组联机。

  20. 所有资源组重新联机之后,退出 clsetup 实用程序。

    键入 q 退出每个子菜单,或按 Ctrl-C

接下来的操作

要向现有的群集中添加节点,请转至以下过程之一:

要在群集节点上创建非全局区域,请转至在群集节点上配置非全局区域

Procedure如何在附加群集节点上配置 Sun Cluster 软件 (scinstall)

执行此过程,将新节点添加到现有群集。要使用 JumpStart 添加新节点,请改为执行如何安装 Solaris 和 Sun Cluster 软件 (JumpStart)中的过程。


注 –

此过程使用的是 scinstall 命令的交互形式。要使用 scinstall 命令的非交互形式(如在开发安装脚本时),请参见 scinstall(1M) 手册页。

在运行 scinstall 命令之前,请确保已在节点上安装了 Sun Cluster 软件包,手动安装或使用 Java ES installer 程序的无提示模式安装均可。有关通过安装脚本运行 Java ES installer 程序的信息,请参见 《Sun Java Enterprise System 5 Installation Guide for UNIX》中的第 5  章 “Installing in Silent Mode”


开始之前

执行以下任务:

按照以下指导信息在此过程中使用交互式的 scinstall 实用程序:

  1. 在要进行配置的群集节点上成为超级用户。

  2. 启动 scinstall 实用程序。


    phys-schost-new# /usr/cluster/bin/scinstall
    

    将显示 scinstall 的主菜单。

  3. 键入 "Create a New Cluster or Add a Cluster Node" 所对应的选项号并按回车键。


      *** Main Menu ***
    
        Please select from one of the following (*) options:
    
          * 1) Create a new cluster or add a cluster node
            2) Configure a cluster to be JumpStarted from this install server
            3) Manage a dual-partition upgrade
            4) Upgrade this cluster node
          * 5) Print release information for this cluster node
    
          * ?) Help with menu options
          * q) Quit
    
        Option:  1
    

    将显示 "New Cluster and Cluster Node" 菜单。

  4. 键入 "Add This Machine as a Node in an Existing Cluster" 所对应的选项号并按回车键。

  5. 按照菜单提示给出您的答案,所做回答应依据于您在配置规划工作单中填写的内容。

    scinstall 实用程序将配置节点并将节点引导到群集中。

  6. 从 DVD-ROM 驱动器中取出 Sun Java Availability Suite DVD-ROM。

    1. 要确保 DVD-ROM 不在使用,更改到属于 DVD-ROM 的目录。

    2. 弹出 DVD-ROM。


      phys-schost# eject cdrom
      
  7. 在所有其他节点上重复此过程以将其添加到群集中,直到完全配置了这些节点。

  8. 对于 Solaris 10 OS,请在每个节点上检验服务器管理工具 (Service Management Facility, SMF) 的多用户服务是否联机。

    如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。


    phys-schost# svcs multi-user-server node
    STATE          STIME    FMRI
    online         17:52:55 svc:/milestone/multi-user-server:default
  9. 从某个活动的群集成员上,阻止其他任何节点加入群集。


    phys-schost# claccess deny-all
    

    或者,也可以使用 clsetup 实用程序。有关过程,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的“如何将节点添加到授权的节点列表中”

  10. 在一个节点上成为超级用户。

  11. 检验所有节点是否都已加入群集。


    phys-schost# clnode status
    

    输出类似于以下内容。


    === Cluster Nodes ===
    
    --- Node Status ---
    
    Node Name                                       Status
    ---------                                       ------
    phys-schost-1                                   Online
    phys-schost-2                                   Online
    phys-schost-3                                   Online

    有关更多信息,请参见 clnode(1CL) 手册页。

  12. 检验是否已安装了所有必要的修补程序。


    phys-schost# showrev -p
    
  13. (可选的)启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled 
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      node
      …
        reboot_on_path_failure:                          enabled
      …
  14. 如果要在具有高可用性的本地文件系统上使用 Sun Cluster HA for NFS,请确保禁用回送文件系统 (loopback file system, LOFS) 。

    要禁用 LOFS,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    exclude:lofs

    /etc/system 文件所做的更改将在下次重新引导系统后生效。


    注 –

    如果在具有高可用性的本地文件系统中使用 Sun Cluster HA for NFS 并且 automountd 正在运行,则不能启用 LOFS。LOFS 会导致 Sun Cluster HA for NFS 出现切换转移问题。如果选择在具有高可用性的本地文件系统上添加 Sun Cluster HA for NFS,则必须进行以下配置更改之一。

    但是,如果要在群集中配置非全局区域,则必须在所有的群集节点上启用 LOFS。如果高可用本地文件系统上的 Sun Cluster HA for NFS 必须与 LOFS 共存,则只能放弃对 LOFS 的禁用改用他法。

    • 禁用 LOFS。

    • 禁用 automountd 守护进程。

    • 从自动安装程序映射中排除属于由 Sun Cluster HA for NFS 导出的具有高可用性的本地文件系统的所有文件。这样做可以使 LOFS 和 automountd 守护进程都保持启用状态。


    有关回送文件系统的更多信息,请参见《系统管理指南:设备和文件系统》Solaris 9Solaris 10)中的“回送文件系统”


示例 3–3 在新增的节点上配置 Sun Cluster 软件

以下示例显示了将节点 phys-schost-3 添加到群集 schost 中的过程。发起节点为 phys-schost-1


*** Adding a Node to an Existing Cluster ***
Fri Feb  4 10:17:53 PST 2005


scinstall -ik -C schost -N phys-schost-1 -A trtype=dlpi,name=qfe2 -A trtype=dlpi,name=qfe3 
-m endpoint=:qfe2,endpoint=switch1 -m endpoint=:qfe3,endpoint=switch2


Checking device to use for global devices file system ... done

Adding node "phys-schost-3" to the cluster configuration ... done
Adding adapter "qfe2" to the cluster configuration ... done
Adding adapter "qfe3" to the cluster configuration ... done
Adding cable to the cluster configuration ... done
Adding cable to the cluster configuration ... done

Copying the config from "phys-schost-1" ... done

Copying the postconfig file from "phys-schost-1" if it exists ... done
Copying the Common Agent Container keys from "phys-schost-1" ... done


Setting the node ID for "phys-schost-3" ... done (id=1)

Setting the major number for the "did" driver ... 
Obtaining the major number for the "did" driver from "phys-schost-1" ... done
"did" driver major number set to 300

Checking for global devices global file system ... done
Updating vfstab ... done

Verifying that NTP is configured ... done
Initializing NTP configuration ... done

Updating nsswitch.conf ... 
done

Adding clusternode entries to /etc/inet/hosts ... done


Configuring IP Multipathing groups in "/etc/hostname.<adapter>" files

Updating "/etc/hostname.hme0".

Verifying that power management is NOT configured ... done

Ensure that the EEPROM parameter "local-mac-address?" is set to "true" ... done
The "local-mac-address?" parameter setting has been changed to "true".

Ensure network routing is disabled ... done

Updating file ("ntp.conf.cluster") on node phys-schost-1 ... done
Updating file ("hosts") on node phys-schost-1 ... done

Rebooting ... 

故障排除

配置不成功-如果有一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Sun Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Sun Cluster 软件包。然后重新执行此过程。

接下来的操作

如果您向使用法定设备的现有群集中添加了节点,请转至如何在向群集中添加节点后更新法定设备

否则,转至如何检验定额配置和安装模式

Procedure如何在新增的群集节点上配置 Sun Cluster 软件 (XML)

要使用 XML 群集配置文件来配置新群集节点,请执行以下过程。新节点可以是某个运行 Sun Cluster 3.2 2/08 软件的现有群集节点的副本。

此过程将对新节点上的下列群集组成部分进行配置:

开始之前

执行以下任务:

  1. 确保要添加到群集中的潜在节点上尚未配置 Sun Cluster 软件。

    1. 在潜在节点上成为超级用户。

    2. 确定潜在节点上是否配置了 Sun Cluster 软件。


      phys-schost-new# /usr/sbin/clinfo -n
      
      • 如果命令失败,请转至步骤 2

        节点上尚未配置 Sun Cluster 软件。可以将潜在节点添加到群集中。

      • 如果命令返回了一个节点 ID 编号,请继续执行步骤 c

        节点上已配置了 Sun Cluster 软件。必须先删除现有的群集配置信息,然后才能将节点添加到其他群集中。

    3. 引导潜在节点进入非群集模式。

      • 在基于 SPARC 的系统中,执行以下命令:


        ok boot -x
        
      • 在基于 x86 的系统中,执行以下命令:

        1. 在 GRUB 菜单中,使用方向键选择适当的 Solaris 条目,然后键入 e 编辑其命令。

          GRUB 菜单显示如下内容:


          GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
          +----------------------------------------------------------------------+
          | Solaris 10 /sol_10_x86                                               |
          | Solaris failsafe                                                     |
          |                                                                      |
          +----------------------------------------------------------------------+
          Use the ^ and v keys to select which entry is highlighted.
          Press enter to boot the selected OS, 'e' to edit the
          commands before booting, or 'c' for a command-line.

          有关基于 GRUB 进行引导的更多信息,请参见《System Administration Guide: Basic Administration》中的第 11  章 “GRUB Based Booting (Tasks)”

        2. 在引导参数屏幕中,使用方向键选择 kernel 条目,然后键入 e 编辑该条目。

          GRUB 引导参数屏幕的显示与以下内容类似:


          GNU GRUB version 0.95 (615K lower / 2095552K upper memory)
          +----------------------------------------------------------------------+
          | root (hd0,0,a)                                                       |
          | kernel /platform/i86pc/multiboot                                     |
          | module /platform/i86pc/boot_archive                                  |
          +----------------------------------------------------------------------+
          Use the ^ and v keys to select which entry is highlighted.
          Press 'b' to boot, 'e' to edit the selected command in the
          boot sequence, 'c' for a command-line, 'o' to open a new line
          after ('O' for before) the selected line, 'd' to remove the
          selected line, or escape to go back to the main menu.
        3. 在命令中添加 -x 以指定将系统引导至非群集模式。


          [ Minimal BASH-like line editing is supported. For the first word, TAB
          lists possible command completions. Anywhere else TAB lists the possible
          completions of a device/filename. ESC at any time exits. ]
          
          grub edit> kernel /platform/i86pc/multiboot -x
          
        4. 按 Enter 键接受更改,并返回到引导参数屏幕。

          屏幕将显示编辑后的命令。


          GNU GRUB version 0.95 (615K lower / 2095552K upper memory)
          +----------------------------------------------------------------------+
          | root (hd0,0,a)                                                       |
          | kernel /platform/i86pc/multiboot -x                                  |
          | module /platform/i86pc/boot_archive                                  |
          +----------------------------------------------------------------------+
          Use the ^ and v keys to select which entry is highlighted.
          Press 'b' to boot, 'e' to edit the selected command in the
          boot sequence, 'c' for a command-line, 'o' to open a new line
          after ('O' for before) the selected line, 'd' to remove the
          selected line, or escape to go back to the main menu.-
        5. 键入 b 将节点引导至非群集模式。


          注 –

          对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请再次执行上述步骤,将 -x 选项添加到内核引导参数命令中。


    4. 在潜在节点上取消对 Sun Cluster 软件的配置。


      phys-schost-new# /usr/cluster/bin/clnode remove
      
  2. 如果要复制某个运行 Sun Cluster 3.2 2/08 软件的节点,请创建一个群集配置 XML 文件。

    1. 在要复制的群集节点上成为超级用户。

    2. 将现有节点的配置信息导出到一个文件中。


      phys-schost# clnode export -o clconfigfile
      
      -o

      指定输出目标。

      clconfigfile

      群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。

      有关更多信息,请参见 clnode(1CL) 手册页。

    3. 将群集配置 XML 文件复制到要配置为新群集节点的潜在节点上。

  3. 在潜在节点上成为超级用户。

  4. 根据需要修改群集配置 XML 文件。

    1. 打开群集配置 XML 文件以进行编辑。

      • 如果打算复制现有的群集节点,请打开使用 clnode export 命令创建的文件。

      • 如果不打算复制现有的群集节点,请创建一个新文件。

        请基于 clconfiguration(5CL) 手册页中显示的元素层次结构来编辑该文件。可将该文件存储到任意目录下。

    2. 修改 XML 元素的值,以反映要创建的节点配置。

      有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。

  5. 验证群集配置 XML 文件。


    phys-schost-new# xmllint --valid --noout clconfigfile
    
  6. 配置新群集节点。


    phys-schost-new# clnode add -n sponsornode -i clconfigfile
    
    -n sponsornode

    指定一个现有群集成员的名称,该成员将作为新节点的发起节点。

    -i clconfigfile

    指定要用作输入源的群集配置 XML 文件的名称。

  7. (可选的)启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled 
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      node
      …
        reboot_on_path_failure:                          enabled
      …
故障排除

配置不成功-如果有一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Sun Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Sun Cluster 软件包。然后重新执行此过程。

接下来的操作

如果是向某个使用法定设备的群集中添加了节点,请转至如何在向群集中添加节点后更新法定设备

否则,转至如何检验定额配置和安装模式

Procedure如何在向群集中添加节点后更新法定设备

如果向群集中添加了节点,则无论您使用的是 SCSI 设备、NAS 设备、法定服务器还是它们之间的组合,您都必须更新法定设备的配置信息。为此,您应删除所有的法定设备并更新全局设备名称空间。您可以重新配置任何仍要使用的法定设备(可选操作)。此操作将向每个法定设备注册新节点,从而使法定设备能够根据群集中节点的新数量重新计算其选票计数。

任何新配置的 SCSI 法定设备都会被设置为 SCSI-3 预留空间。

开始之前

确保在添加的节点上已经完成了 Sun Cluster 软件的安装。

  1. 在群集中的任一节点上成为超级用户。

  2. 查看当前的法定配置。

    命令输出中将列出每个法定设备和每个节点。以下输出示例中显示出了当前的 SCSI 法定设备 d3


    phys-schost# clquorum list
    d3
    …
  3. 记下列出的每个法定设备的名称。

  4. 删除原始法定设备。

    对已配置的每个法定设备执行此步骤。


    phys-schost# clquorum remove devicename
    
    devicename

    指定法定设备的名称。

  5. 检验是否删除了所有原始法定设备。

    如果法定设备删除成功,将不会列出任何法定设备。


    phys-schost# clquorum status
    
  6. 更新全局设备名称空间。


    phys-schost# cldevice populate
    

    注 –

    必须执行此步骤以防止可能发生的节点紊乱。


  7. 尝试添加法定设备之前,请先在每个节点上检验 cldevice populate 命令是否已完成处理。

    即使仅从一个节点中发出 cldevice populate 命令,该命令也会以远程方式在所有节点上执行。要确定 cldevice populate 命令是否已完成处理过程,请在群集的每个节点上运行以下命令。


    phys-schost# ps -ef | grep scgdevs
    
  8. (可选的)添加法定设备。

    可以对原来配置为法定设备的同一台设备进行配置,也可以选择新的共享设备进行配置。

    1. (可选的)如果需要选择新的共享设备以将其配置为法定设备,将显示系统检查到的所有设备。

      否则,跳至步骤 c


      phys-schost# cldevice list -v
      

      输出类似于以下内容:


      DID Device          Full Device Path
      ----------          ----------------
      d1                  phys-schost-1:/dev/rdsk/c0t0d0
      d2                  phys-schost-1:/dev/rdsk/c0t6d0
      d3                  phys-schost-2:/dev/rdsk/c1t1d0
      d3                  phys-schost-1:/dev/rdsk/c1t1d0 
      …
    2. 从输出信息中,选择一个共享设备将其配置为法定设备。

    3. 将共享设备配置为法定设备。


      phys-schost# clquorum add -t type devicename
      
      -t type

      指定法定设备的类型。如果不指定此选项,将使用默认类型 scsi

    4. 对需要配置的每个法定设备重复执行上述操作。

    5. 检验新的法定配置。


      phys-schost# clquorum list
      

      输出结果中应列出每个法定设备和每个节点。


示例 3–4 向双节点群集中添加节点后更新 SCSI 法定设备

下面的示例依次执行了以下操作:找到原 SCSI 法定设备 d2,删除该法定设备,列出可用的共享设备,更新全局设备名称空间,将 d3 配置为新的 SCSI 法定设备,检验新设备。


phys-schost# clquorum list
d2
phys-schost-1
phys-schost-2

phys-schost# clquorum remove d2
phys-schost# clquorum status
…
--- Quorum Votes by Device ---

Device Name       Present      Possible      Status
-----------       -------      --------      ------
phys-schost# cldevice list -v
DID Device          Full Device Path
----------          ----------------
…
d3                  phys-schost-2:/dev/rdsk/c1t1d0
d3                  phys-schost-1:/dev/rdsk/c1t1d0
…
phys-schost# cldevice populate
phys-schost# ps -ef - grep scgdevs
phys-schost# clquorum add d3
phys-schost# clquorum list
d3
phys-schost-1
phys-schost-2

接下来的操作

转至如何检验定额配置和安装模式

Procedure如何配置法定设备


注 –

在以下几种情况下不需要配置法定设备:

应继续执行如何检验定额配置和安装模式中的过程。


在完全形成群集后只执行一次该过程。使用此过程以分配定额选票并使群集脱离安装模式。

开始之前

将法定服务器或 NAS 设备配置为法定设备之前,需执行以下准备工作。

  1. 要将法定服务器用作法定设备,请为群集做好准备,使其能够与法定服务器进行通信。

    1. 编辑法定服务器配置文件 /etc/scqsd/scqsd.conf

      安装 Sun Cluster 软件时,将会创建一个默认配置文件 /etc/scqsd/scqsd.conf,该文件中包含有关单个默认法定服务器的信息。/etc/scqsd/scqsd.conf 文件中的每行都采用以下格式:


      /usr/cluster/lib/sc/scqsd [-d quorumdirectory] [-i instancename] -p port
      
      /usr/cluster/lib/sc/scqsd

      安装 Sun Cluster 软件的完整路径。此值必须为 /usr/cluster/lib/sc/scqsd

      -d quorumdirectory

      法定服务器可存储法定数据的目录路径。

      法定服务器进程会在此目录中为每个群集创建一个文件,以存储特定于群集的法定信息。默认情况下,此选项的值为 /var/scqsd。对于所配置的每个法定服务器,此目录必须是唯一的。

      -i instancename

      为法定服务器实例选择的唯一名称。

      -p port

      法定服务器在其上侦听来自群集的请求的端口号。默认端口为 9000。

      实例名称是可选的。如果为法定服务器指定名称,则该名称在系统的所有法定服务器中必须是唯一的。如果选择省略该实例名称选项,则必须通过法定服务器所侦听的端口来指示法定服务器。

    2. 如果公共网络使用长度可变的子网,也称为无类别域间路由 (Classless Inter-Domain Routing, CIDR),请在每个节点上修改以下文件。

      如果您使用的是 RFC 791 中所定义的有类别子网,则无需执行这些步骤。

      1. /etc/inet/netmasks 文件中,为群集所使用的每个公共子网添加一个相应的条目。

        以下是一个包含了某个公共网络 IP 地址和网络掩码的条目示例:


        10.11.30.0	255.255.255.0
      2. netmask + broadcast + 添加到每个 /etc/hostname.adapter 文件中主机名条目的后面。


        nodename netmask + broadcast +
        
    3. 确保将法定服务器的 IP 地址包含在群集内每个节点上的 /etc/inet/hosts/etc/inet/ipnodes 文件中。

    4. 如果使用了命名服务,请确保将法定服务器包含在名称到地址的映射中。

  2. 在一个节点上成为超级用户。

  3. 要将共享 SCSI 磁盘用作法定设备,请检验设备与群集节点是否已连接并选择要配置的设备。

    1. 在群集中的一个节点上,显示系统检查到的所有设备的列表。

      运行此命令无需超级用户身份。


      phys-schost-1# cldevice list -v
      

      输出类似于以下内容:


      DID Device          Full Device Path
      ----------          ----------------
      d1                  phys-schost-1:/dev/rdsk/c0t0d0
      d2                  phys-schost-1:/dev/rdsk/c0t6d0
      d3                  phys-schost-2:/dev/rdsk/c1t1d0
      d3                  phys-schost-1:/dev/rdsk/c1t1d0
      …
    2. 确保输出信息显示了群集节点与存储设备之间的所有连接。

    3. 确定要配置为法定设备的每个共享磁盘的全局设备 ID。


      注 –

      所选的任何共享磁盘都必须能够用作法定设备。有关选择法定设备的更多信息,请参见法定设备


      使用步骤 a 中的 scdidadm 的输出信息来标识配置为法定设备的每个共享磁盘的设备 ID 名称。例如,步骤 a 中的输出信息显示全局设备 d2 是由 phys-schost-1phys-schost-2 共享的。

  4. 启动 clsetup 实用程序。


    phys-schost# clsetup
    

    将显示“Initial Cluster Setup”屏幕。


    注 –

    如果实际显示的是“主菜单”,则说明初始群集设置已成功执行。跳到步骤 9


  5. 回答提示问题 Do you want to add any quorum disks?

    • 如果群集是双节点群集,必须配置至少一个共享法定设备。键入 Yes 以配置一个或多个法定设备。

    • 如果群集由三个以上的节点组成,则定额设备的配置可根据您自己的需要而定。

      • 如果不需要配置其他法定设备,则键入 No。然后跳到步骤 8

      • 键入 Yes 以配置其他法定设备。然后继续执行步骤 6

  6. 指定要将哪类设备配置为法定设备。

    法定设备类型 

    描述 

    scsi

    Sun NAS 设备或共享 SCSI 磁盘 

    quorum_server

    法定服务器 

    netapp_nas

    Network Appliance NAS 设备 

  7. 指定要配置为法定设备的设备的名称。

    • 对于法定服务器,还需指定以下信息:

      • 法定服务器主机的 IP 地址

      • 法定服务器用来与群集节点进行通信的端口号

    • 对于 Network Appliance NAS 设备,还需指定以下信息:

      • NAS 设备的名称

      • NAS 设备的 LUN ID

  8. 显示 Is it okay to reset "installmode"? 提示时,请键入 Yes

    clsetup 实用程序在为群集设置了法定配置和选票计数后,将显示以下消息:“已完成群集初始化”。该实用程序将于此时返回到“主菜单”。

  9. 退出 clsetup 实用程序。

接下来的操作

检验是否已禁用定额配置及安装模式。转至如何检验定额配置和安装模式

故障排除

被中断的 clsetup 处理-如果法定设置过程被中断或无法成功完成,请重新运行 clsetup

对法定选票计数的更改 - 如果您以后会增加或减少连接到法定设备的节点数,系统将不会自动重新计算法定选票计数。通过删除各个法定设备,然后将其添加回配置可以重新建立正确的法定选票。每次对一个法定设备进行操作。对于双节点群集,请临时添加一个新的法定设备,然后删除原法定设备并将其添加回配置。然后,删除临时法定设备。请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的第 6  章 “管理法定”中的“如何修改法定设备节点列表”过程。

Procedure如何检验定额配置和安装模式

执行该过程以检验法定配置是否已成功完成,并检验群集安装模式是否已被禁用。

您不必成为超级用户就可以运行这些命令。

  1. 从任何节点检验设备和节点的定额配置。


    phys-schost% clquorum list
    

    输出结果中将列出每个法定设备和每个节点。

  2. 在任一节点上,检验群集安装模式是否已禁用。


    phys-schost% cluster show -t global | grep installmode
      installmode:                                    disabled

    群集安装已完成。

接下来的操作

查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。

另请参见

对群集配置进行备份。对群集配置的归档备份有助于您更方便地恢复群集配置。有关更多信息,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的“如何备份群集配置”

Procedure如何更改专用主机名

如果不希望使用默认专用主机名 clusternodenodeid-priv(该专用主机名是在安装 Sun Cluster 软件的过程中指定的),请执行此任务。


注 –

在配置并启动了应用程序和数据服务后,请不要执行该过程。否则,在重命名旧的专用主机名后,应用程序或数据服务可能仍使用旧的专用主机名,从而造成主机名冲突。如果有一些应用程序或数据服务正在运行,则停止它们,然后再执行该过程。


请在一个活动的群集节点上执行此过程。

  1. 成为群集节点的超级用户。

  2. 启动 clsetup 实用程序。


    phys-schost# clsetup
    

    屏幕上将显示 clsetup 主菜单。

  3. 输入 "Private Hostnames" 所对应的选项号并按回车键。

    将显示 "Private Hostname" 菜单。

  4. 键入 "Change a Private Hostname" 所对应的选项号并按回车键。

  5. 按照提示更改专用主机名。

    对于每个要更改的专用主机名,请重复该过程。

  6. 检验新的专用主机名。


    phys-schost# clnode show -t node | grep privatehostname
      privatehostname:                                clusternode1-priv
      privatehostname:                                clusternode2-priv
      privatehostname:                                clusternode3-priv
接下来的操作

查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。

Procedure如何配置网络时间协议 (NTP)


注 –

如果在安装 Sun Cluster 软件之前安装了您自己的 /etc/inet/ntp.conf 文件,则无需执行此过程。确定下一个步骤:


在执行了以下任意一个任务后,请执行此任务以创建或修改 NTP 配置文件:

如果向单节点群集中添加了节点,则必须确保将所使用的 NTP 配置文件复制到原始群集节点以及新节点中。

在群集内配置 NTP 或任何时间同步设备时,首要条件是必须将所有群集节点同步为同一时间。除了同步节点之间的时间之外,其次还要考虑单个节点上的时间准确性。如果满足该基本同步要求,则可以自由配置 NTP,最大限度地满足您个人的需要。

有关群集时间的更多信息,请参见《Sun Cluster Concepts Guide for Solaris OS》。有关如何配置 NTP 以用于 Sun Cluster 配置的其他指导,请参见 /etc/inet/ntp.cluster 模板文件。

  1. 成为群集节点的超级用户。

  2. 如果您有自己的 /etc/inet/ntp.conf 文件,请将该文件复制到群集中的每个节点上。

  3. 如果没有自己的 /etc/inet/ntp.conf 文件可以安装,请使用 /etc/inet/ntp.conf.cluster 文件作为 NTP 配置文件,


    注 –

    请不要将 ntp.conf.cluster 文件重命名为 ntp.conf


    如果该节点上没有 /etc/inet/ntp.conf.cluster 文件,则可能在以前安装 Sun Cluster 软件时创建了 /etc/inet/ntp.conf 文件。如果该节点上没有 /etc/inet/ntp.conf 文件,Sun Cluster 软件会将 /etc/inet/ntp.conf.cluster 文件创建为 NTP 配置文件。如果是这样,则进而对该 ntp.conf 文件执行以下编辑。

    1. 使用首选的文本编辑器打开群集中某一节点上的 NTP 配置文件以进行编辑。

    2. 确保每个群集节点的专用主机名都存在一个条目。

      如果更改了任何节点的专用主机名,请确保 NTP 配置文件中包含该节点的新专用主机名。

    3. 如果需要,可进行一些其他修改来满足 NTP 要求。

    4. 将 NTP 配置文件复制到群集中的所有节点上。

      所有群集节点上的 NTP 配置文件的内容必须相同。

  4. 停止每个节点上的 NTP 守护进程。

    应等到在每个节点上都成功完成以下命令之后,再继续执行步骤 5

    • SPARC:对于 Solaris 9 OS,请使用以下命令:


      phys-schost# /etc/init.d/xntpd stop
      
    • 对于 Solaris 10 OS,请使用以下命令:


      phys-schost# svcadm disable ntp
      
  5. 在每个节点上重新启动 NTP 守护程序。

    • 如果使用 ntp.conf.cluster 文件,请运行以下命令:


      phys-schost# /etc/init.d/xntpd.cluster start
      

      xntpd.cluster 启动脚本首先查找 /etc/inet/ntp.conf 文件。

      • 如果 ntp.conf 文件存在,则脚本将立即退出而不启动 NTP 守护进程。

      • 如果 ntp.conf 文件不存在而 ntp.conf.cluster 文件存在,该脚本将启动 NTP 守护进程。在这种情况下,该脚本会将 ntp.conf.cluster 文件用作 NTP 配置文件。

    • 如果使用 ntp.conf 文件,请运行以下命令之一:

      • SPARC:对于 Solaris 9 OS,请使用以下命令:


        phys-schost# /etc/init.d/xntpd start
        
      • 对于 Solaris 10 OS,请使用以下命令:


        phys-schost# svcadm enable ntp
        
接下来的操作

查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。

Procedure如何记录群集配置的诊断数据

完成群集配置后但在投入生产前,请使用 Sun Explorer 实用程序记录关于群集的基本信息。 如果将来需要排除群集故障,可以使用该数据。

  1. 成为超级用户。

  2. 在群集中的每个节点上,运行 explorer 实用程序。

    针对您的平台使用相应的命令:

    服务器 

    命令 

    Sun Fire 3800 至 6800 

    # explorer -i -w default,scextended

    Sun Fire V1280 和 E2900 

    # explorer -i -w default,1280extended

    Sun Fire T1000 和 T2000 

    # explorer -i -w default,Tx000

    Sun Fire X4x00 和 X8x00 

    # explorer -i -w default,ipmi

    所有其他平台 

    # explorer -i

    有关更多信息,请参见 /opt/SUNWexplo/man/man1m/ 目录下的 explorer(1M) 手册页和《Sun Explorer User’s Guide》

    explorer 的输出文件保存在 /opt/SUNWexplo/output/ 目录下,名为 explorer.hostid.hostname-date.tar.gz

  3. 将该文件保存到当整个群集停机时可以访问的位置。

  4. 通过电子邮件将所有 explorer 文件发送到您所处地理位置的 Sun Explorer 数据库别名下。

    如果在对您的群集进行技术问题诊断时需要 explorer 输出数据,该数据库可使 Sun 技术支持获取这些数据。

    位置 

    电子邮件地址 

    北美洲、中美洲和南美洲 (AMER) 

    explorer-database-americas@sun.com

    欧洲、中东和非洲 (EMEA) 

    explorer-database-emea@sun.com

    亚洲、澳大利亚、新西兰和太平洋地区 (APAC) 

    explorer-database-apac@sun.com