Sun Cluster 软件安装指南(适用于 Solaris OS)

Procedure如何在所有节点上配置 Sun Cluster 软件 (XML)

要使用 XML 群集配置文件来配置新群集,请执行以下过程。新群集可以是某个运行 Sun Cluster 3.2 软件的现有群集的副本。

此过程将对群集中的以下组成部分进行配置:

开始之前

执行以下任务:

  1. 确保每个潜在的群集节点上均尚未配置 Sun Cluster 3.2 软件。

    1. 在要配置到新群集中的潜在节点上成为超级用户。

    2. 确定潜在节点上是否已配置了 Sun Cluster 3.2 软件。


      phys-schost# /usr/sbin/clinfo -n
      
      • 如果命令返回以下消息,请继续执行步骤 c。


        clinfo: node is not configured as part of acluster: Operation not applicable

        此消息表明潜在节点上尚未配置 Sun Cluster 软件。

      • 如果命令返回节点 ID 编号,请不要执行此过程。

        返回节点 ID 表明节点上已配置了 Sun Cluster 软件。

        如果群集上正在运行旧版本的 Sun Cluster 软件,而您希望安装 Sun Cluster 3.2 软件,请转而执行第 8 章,升级 Sun Cluster 软件中的升级过程。

    3. 在要配置到新群集中的其余每个潜在节点上,重复执行步骤 a 和步骤 b。

      如果所有的潜在群集节点上都尚未配置 Sun Cluster 3.2 软件,请继续执行步骤 2。

  2. 如果要复制某个运行 Sun Cluster 3.2 软件的现有群集,请使用该群集中的某一节点创建一个群集配置 XML 文件。

    1. 对于要复制的群集,在该群集中的某个活动成员上成为超级用户。

    2. 将现有群集的配置信息导出到一个文件中。


      phys-schost# cluster export -o clconfigfile
      
      -o

      指定输出目标。

      clconfigfile

      群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。

      有关更多信息,请参见 cluster(1CL) 手册页。

    3. 将配置文件复制到将用来配置新群集的潜在节点上。

      您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。

  3. 在将用来配置新群集的潜在节点上成为超级用户。

  4. 根据需要修改群集配置 XML 文件。

    1. 打开群集配置 XML 文件以进行编辑。

      • 如果打算复制现有群集,请打开使用 cluster export 命令创建的文件。

      • 如果不打算复制现有群集,请创建一个新文件。

        请基于 clconfiguration(5CL) 手册页中显示的元素层次结构来编辑该文件。您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。

    2. 修改 XML 元素的值,以反映要创建的群集配置。

      • 为了能建立群集,群集配置 XML 文件中的以下组成部分必须具有有效值:

        • 群集名称

        • 群集节点

        • 群集传输

      • 系统在创建群集时会假定,配置为群集节点的每个节点上都存在着 /globaldevices 分区。全局设备名称空间将在此分区上创建。如果您需要使用其他文件系统名称来创建全局设备,则对于不具有 /globaldevices 分区的每个节点,请在其 <propertyList> 元素中添加以下属性。


        …
          <nodeList>
            <node name="node" id="N">
              <propertyList>
        …
                <property name="globaldevfs" value="/filesystem-name"/>
        …
              </propertyList>
            </node>
        …
      • 如果您正在修改从现有群集中导出的配置信息,则必须更改某些值(如节点名称)以反映新群集的情况,这些值会用于多个群集对象的定义中。

      有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。

  5. 验证群集配置 XML 文件。


    phys-schost# /usr/share/src/xmllint --valid --noout clconfigfile
    

    有关更多信息,请参见 xmllint(1) 手册页。

  6. 从包含群集配置 XML 文件的潜在节点上创建群集。


    phys-schost# cluster create -i clconfigfile
    
    -i clconfigfile

    指定要用作输入源的群集配置 XML 文件的名称。

  7. 对于 Solaris 10 OS,请在每个节点上检验 Service Management Facility (SMF) 的多用户服务是否联机。

    如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。


    phys-schost# svcs multi-user-server
    STATE          STIME    FMRI
    online         17:52:55 svc:/milestone/multi-user-server:default
  8. 在一个节点上成为超级用户。

  9. 检验所有节点是否都已加入群集。


    phys-schost# clnode status
    

    输出类似于以下内容。


    === 群集节点 ===
    
    --- 节点状态 ---
    
    节点名称                                             状态
    ---------                                       ------
    phys-schost-1                                   联机
    phys-schost-2                                   联机
    phys-schost-3                                   联机

    有关更多信息,请参见 clnode(1CL) 手册页。

  10. 安装支持 Sun Cluster 软件必需的所有修补程序(如果尚未这样做)。

    有关修补程序和安装说明所在的位置,请参见《Sun Cluster 3.2 发行说明(适用于 Solaris OS)》中的“修补程序和所需的固件级别”

  11. 如果要在具有高可用性的本地文件系统上使用 Sun Cluster HA for NFS,请确保禁用回送文件系统 (Loopback File System, LOFS)。

    要禁用 LOFS,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    exclude:lofs

    /etc/system 文件所做的更改将在下次重新引导系统后生效。


    注 –

    如果在具有高可用性的本地文件系统中使用 Sun Cluster HA for NFS 并且 automountd 正在运行,则不能启用 LOFS。LOFS 会导致 Sun Cluster HA for NFS 出现切换转移问题。如果选择在具有高可用性的本地文件系统上添加 Sun Cluster HA for NFS,则必须进行以下配置更改之一。

    但是,如果要在群集中配置非全局区域,则必须在所有的群集节点上启用 LOFS。如果高可用本地文件系统上的 Sun Cluster HA for NFS 必须与 LOFS 共存,则只能放弃对 LOFS 的禁用改用他法。

    • 禁用 LOFS。

    • 禁用 automountd 守护进程。

    • 从自动安装程序映射中排除属于由 Sun Cluster HA for NFS 导出的具有高可用性的本地文件系统的所有文件。这样做可以使 LOFS 和 automountd 守护进程都保持启用状态。


    有关回送文件系统的更多信息,请参见《系统管理指南:设备和文件系统》Solaris 9Solaris 10)中的“回送文件系统”一节。

  12. 要从现有群集中复制法定信息,请使用群集配置 XML 文件配置法定设备。

    如果创建了双节点群集,则必须配置一个法定设备。如果您选择不使用群集配置 XML 文件来创建所需的法定设备,请转至如何配置法定设备

    1. 如果要将法定服务器用作法定设备,请确保法定服务器已经过设置并且正在运行。

      请按照《Sun Cluster Quorum Server User’s Guide》中的说明进行操作。

    2. 如果要将 Network Appliance NAS 设备用作法定设备,请确保 NAS 设备已经过设置并且正在运行。

      1. 请遵循将 NAS 设备用作法定设备方面的相关要求。

        具体内容,请参见《Sun Cluster 3.1 - 3.2 With Network-Attached Storage Devices Manual for Solaris OS》中的“Requirements, Recommendations, and Restrictions for Network Appliance NAS Devices”

      2. 请按照设备文档中的说明来设置 NAS 设备。

    3. 确保群集配置 XML 文件中的法定配置信息反映的是所创建群集的有效值。

    4. 如果对群集配置 XML 文件进行过更改,请验证该文件。


      phys-schost# xmllint --valid --noout clconfigfile
      
    5. 配置法定设备。


      phys-schost# clquorum add -i clconfigfile devicename
      
      devicename

      指定要配置为法定设备的设备的名称。

  13. 使群集脱离安装模式。


    phys-schost# clquorum reset
    
  14. (可选的)启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === 群集节点 ===                          
      
      节点名称:                                      node
      …
        reboot_on_path_failure:                          已启用
      …

示例 3–2 使用 XML 文件在所有节点上配置 Sun Cluster 软件

以下示例将一个现有双节点群集的群集配置和法定配置复制到了一个新的双节点群集中。新群集安装了 Solaris 10 OS,并且未配置非全局区域。群集配置将从现有群集节点 phys-oldhost-1 导出到群集配置 XML 文件 clusterconf.xml 中。新群集的节点名称为 phys-newhost-1phys-newhost-2。新群集中被配置为法定设备的设备是 d3

此示例中的提示符名称 phys-newhost-N 表示应在两个群集节点上执行相应的命令。


phys-newhost-N# /usr/sbin/clinfo -n
clinfo: node is not configured as part of acluster: Operation not applicable
 
phys-oldhost-1# cluster export -o clusterconf.xml
Copy clusterconf.xml to phys-newhost-1 and modify the file with valid values
 
phys-newhost-1# xmllint --valid --noout clusterconf.xml
No errors are reported
 
phys-newhost-1# cluster create -i clusterconf.xml
phys-newhost-N# svcs multi-user-server
STATE          STIME    FMRI
online         17:52:55 svc:/milestone/multi-user-server:default
phys-newhost-1# clnode status
Output shows that both nodes are online
 
phys-newhost-1# clquorum add -i clusterconf.xml d3
phys-newhost-1# clquorum reset

故障排除

配置不成功 - 如果有一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Sun Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Sun Cluster 软件包。然后重新执行此过程。

接下来的操作

转至如何检验定额配置和安装模式

另请参见

完全建立了群集之后,您可以从现有群集中复制其他群集组成部分的配置。如果尚未这样做,请修改要复制的 XML 元素的值,以反映要将组成部分添加到其中的群集配置。例如,如果要复制资源组,请确保 <resourcegroupNodeList> 条目包含的是对新群集而言有效的节点名称,而不是所复制群集中的节点名称,除非它们与新群集中的节点名称相同。

要复制群集组成部分,请对要复制的群集组成部分运行面向对象命令的 export 子命令。有关面向对象命令的语法和选项的更多信息,请参见要复制的群集对象所对应的手册页。下表列出了在建立群集之后可以通过群集配置 XML 文件创建的群集组成部分,以及用来复制各组成部分的命令所对应的手册页。


注 –

此表提供了各个 Sun Cluster 命令的完整形式。此外,大多数命令还有简短格式。除了命令名称的形式以外,简写形式和完整形式的命令是相同的。有关各命令及其简写形式的列表,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的附录 A “Sun Cluster 面向对象的命令”


群集组成部分 

手册页 

特殊说明 

设备组:Solaris Volume Manager 和 VERITAS Volume Manager 

cldevicegroup(1CL)

对于 Solaris Volume Manager,应首先创建您在群集配置 XML 文件中指定的磁盘集。 

对于 VxVM,应首先安装并配置 VxVM 软件,然后再创建您在群集配置 XML 文件中指定的磁盘组。 

资源 

clresource(1CL)

使用 clresourceclressharedaddressclreslogicalhostname 命令的 -a 选项可以在复制资源的同时复制与之相关联的资源类型和资源组。

如果不使用该选项,则在添加资源之前必须先将其资源类型和资源组添加到群集中。 

共享地址资源 

clressharedaddress(1CL)

逻辑主机名资源 

clreslogicalhostname(1CL)

资源类型 

clresourcetype(1CL)

资源组 

clresourcegroup(1CL)

NAS 设备 

clnasdevice(1CL)

必须首先按照 NAS 设备文档中的介绍设置此类设备。 

SNMP 主机 

clsnmphost(1CL)

clsnmphost create -i 命令要求您用 -f 选项指定用户密码文件。

SNMP 用户 

clsnmpuser(1CL)

 

监视用于群集对象的系统资源时所使用的阈值 

cltelemetryattribute(1CL)