Sun Cluster 软件安装指南(适用于 Solaris OS)

Procedure如何安装 Solaris 和 Sun Cluster 软件 (JumpStart)

此过程介绍了如何设置和使用 scinstall(1M) 自定义 JumpStart 安装方法。此方法可将 Solaris OS 和 Sun Cluster 软件安装在所有群集节点上,并建立群集。您也可以使用此过程向现有的群集添加新节点。

开始之前

执行以下任务:

按照以下指导信息在此过程中使用交互式的 scinstall 实用程序:

  1. 设置 JumpStart 安装服务器。

    确保 JumpStart 安装服务器符合下列要求。

    • 安装服务器位于群集节点所在的子网中,或者位于群集节点使用的子网对应的 Solaris 引导服务器上。

    • 安装服务器本身不是群集节点。

    • 安装服务器将安装 Sun Cluster 软件支持的某个 Solaris OS 发行版本。

    • 有一个定制 JumpStart 目录可用于 Sun Cluster 软件的 JumpStart 安装。此 jumpstart-dir 目录必须符合下列要求:

      • 包含 check 实用程序的副本。

      • 是为了供 JumpStart 安装服务器读取而导出的 NFS。

    • 每个新的群集节点都配置为一个自定义的 JumpStart 安装客户机,该客户机使用为 Sun Cluster 安装设置的自定义 JumpStart 目录。

    按照与您的软件平台和 OS 版本相应的说明来设置 JumpStart 安装服务器。请参见《Solaris 9 9/04 Installation Guide》中的“Creating a Profile Server for Networked Systems”《Solaris 10 8/07 Installation Guide: Custom JumpStart and Advanced Installations》中的“Creating a Profile Server for Networked Systems”

    另请参见 setup_install_server(1M) 手册页和 add_install_client(1M) 手册页。

  2. 如果要将新节点安装到现有的群集,请将该节点添加到授权的群集节点列表中。

    1. 切换到另一个活动的群集节点,并启动 clsetup 实用程序。

    2. 使用 clsetup 实用程序将新节点的名称添加到授权群集节点列表中。

    有关更多信息,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》中的“如何将节点添加到授权的节点列表中”

  3. 在群集节点或运行相同服务器平台的另一台计算机上,安装 Solaris OS 和所有必要的修补程序(如果尚未这样做)。

    如果服务器上已安装了 Solaris 软件,必须确保 Solaris 安装符合 Sun Cluster 软件和任何其他要在群集中安装的软件的要求。有关安装符合 Sun Cluster 软件要求的 Solaris 软件的更多信息,请参见如何安装 Solaris 软件

    请按照如何安装 Solaris 软件中的过程操作。

  4. 在已安装的系统上,安装 Sun Cluster 软件和所有必要的修补程序(如果尚未这样做)。

    请按照如何安装 Sun Cluster 框架和数据服务软件包中的过程操作。

    有关修补程序的位置和安装说明,请参见《Sun Cluster 3.2 2/08 Release Notes for Solaris OS》

  5. 启用公共代理容器守护进程,使其在系统引导期间自动启动。


    machine# cacaoadm enable
    
  6. 在已安装的系统上,使用群集中所用的所有公共 IP 地址更新 /etc/inet/ipnodes 文件。

    执行此步骤,无论是否正在使用命名服务。有关必须添加其 IP 地址的 Sun Cluster 组件的列表,请参见公共网络 IP 地址

  7. 创建已安装系统的 Flash 归档文件。


    machine# flarcreate -n name archive
    
    -n name

    为 Flash 归档文件指定的名称。

    archive

    为 Flash 归档文件指定的文件名,带有完整路径。根据约定,文件名以 .flar 结尾。

    按照以下一本手册中的过程执行操作:

  8. 确保 Flash 归档文件是为了供 JumpStart 安装服务器读取而导出的 NFS。

    有关自动共享文件的更多信息,请参见《系统管理指南:网络服务》Solaris 9Solaris 10)中的“管理网络文件系统(概述)”

    另请参见 share(1M) 手册页和 dfstab(4) 手册页。

  9. 在 JumpStart 安装服务器上成为超级用户。

  10. 从 JumpStart 安装服务器启动 scinstall(1M) 实用程序。

    此例中假定您创建的 JumpStart 安装目录路径为 /export/suncluster/sc31/。在介质路径中,请将 arch 替换为 sparcx86(仅限于 Solaris 10),将 ver 替换为 9(对于 Solaris 9)或 10(对于 Solaris 10)。


    installserver# cd /export/suncluster/sc31/Solaris_arch/Product/sun_cluster/ \
    Solaris_ver/Tools/
    installserver# ./scinstall
    

    将显示 scinstall 的主菜单。

  11. 键入 "Configure a Cluster to be JumpStarted From This Install Server" 所对应的选项号并按回车键。

    此选项用于配置定制 JumpStart 的结束脚本。JumpStart 使用这些结束脚本来安装 Sun Cluster 软件。


     *** Main Menu ***
     
        Please select from one of the following (*) options:
    
          * 1) Create a new cluster or add a cluster node
          * 2) Configure a cluster to be JumpStarted from this install server
            3) Manage a dual-partition upgrade
            4) Upgrade this cluster node
          * 5) Print release information for this cluster node 
    
          * ?) Help with menu options
          * q) Quit
     
        Option:  2
    
  12. 按照菜单提示给出您的答案,所做回答应依据于您在配置规划工作单中填写的内容。

    scinstall 命令可存储您的配置信息,并将默认的 class 文件 autoscinstall.class 复制到 /jumpstart-dir/autoscinstall.d/3.2/ 目录下。此文件类似于以下示例。


    install_type    initial_install
    system_type     standalone
    partitioning    explicit
    filesys         rootdisk.s0 free /
    filesys         rootdisk.s1 750  swap
    filesys         rootdisk.s3 512  /globaldevices
    filesys         rootdisk.s7 20
    cluster         SUNWCuser        add
    package         SUNWman          add
  13. 如有必要,请通过修改 autoscinstall.class 文件来配置 JumpStart,以便安装 Flash 归档文件。

    1. 根据需要修改条目,使其符合您在 Flash 归档计算机上安装 Solaris OS 时或运行 scinstall 实用程序时所做的配置选择。

      例如,如果为全局设备文件系统指定分片 4 并为 scinstall 指定文件系统名称为 /gdevs,则需要将 autoscinstall.class 文件的 /globaldevices 条目更改为:


      filesys         rootdisk.s4 512  /gdevs
    2. 更改 autoscinstall.class 文件中的以下条目。

      要替换的现有条目 

      要添加的新条目 

      install_type

      initial_install

      install_type

      flash_install

      system_type

      standalone

      archive_location

      retrieval_type location

      有关 retrieval_typelocationarchive_location 关键字一起使用时的有效值信息,请参见《Solaris 9 9/04 安装指南》《Solaris 10 安装指南:自定义 JumpStart 和高级安装》中的archive_location 关键字”

    3. 删除将安装特定软件包的所有条目,例如以下条目。


      cluster         SUNWCuser        add
      package         SUNWman          add
    4. 如果配置中带有其他 Solaris 软件要求,请相应地更改 autoscinstall.class 文件。

      autoscinstall.class 文件将安装最终用户 Solaris 软件组 (SUNWCuser)。

    5. 如果安装最终用户 Solaris 软件组 (SUNWCuser),请将可能需要的所有附加 Solaris 软件包添加到 autoscinstall.class 文件中。

      下表列出了支持某些 Sun Cluster 功能所需的 Solaris 软件包。最终用户 Solaris 软件组中不包含这些软件包。有关更多信息,请参见Solaris 软件组注意事项

      特性 

      必需的 Solaris 软件包 

      RSMAPI、RSMRDT 驱动程序或 SCI-PCI 适配器(仅基于 SPARC 的群集) 

      SPARC:Solaris 9SUNWrsm SUNWrsmx SUNWrsmo SUNWrsmox

      Solaris 10SUNWrsm SUNWrsmo

      Sun Cluster Manager(原名 SunPlexTM Manager)

      SUNWapchr SUNWapchu

    您可以用以下方法之一更改缺省的 class 文件:

    • 直接编辑 autoscinstall.class 文件。这些更改应用于使用该定制的 JumpStart 目录的所有群集中的所有节点。

    • 更新 rules 文件使其指向其他配置文件,然后运行 check 实用程序来验证 rules 文件。

    只要 Solaris 操作系统的安装配置文件符合 Sun Cluster 文件系统的最低分配要求,Sun Cluster 软件便不会限制对安装配置文件的其他更改。有关为了支持 Sun Cluster 软件而应遵循的分区指导信息和要求,请参见系统磁盘分区

    有关 JumpStart 配置文件的更多信息,请参见《Solaris 9 9/04 Installation Guide》中的第 26  章 “Preparing Custom JumpStart Installations (Tasks)”《Solaris 10 8/07 Installation Guide: Custom JumpStart and Advanced Installations》中的第 3  章 “Preparing Custom JumpStart Installations (Tasks)”

  14. 要安装以下各功能部件所需的软件包或执行其他安装后任务,请设置您自己的结束脚本。

    • 远程共享内存应用程序编程接口 (RSMAPI)

    • 用于互连传输的 SCI-PCI 适配器

    • RSMRDT 驱动程序


    注 –

    RSMRDT 驱动程序只能在运行已启用 RSM 的 Oracle9i 版本 2 SCI 配置的群集中使用。有关详细的安装和配置说明,请参阅 Oracle9i 版本 2 的用户文档。


    您的结束脚本在由 scinstall 命令安装的标准结束脚本之后运行。有关创建 JumpStart 结束脚本的信息,请参见《Solaris 9 9/04 Installation Guide》中的第 26  章 “Preparing Custom JumpStart Installations (Tasks)”《Solaris 10 8/07 Installation Guide: Custom JumpStart and Advanced Installations》中的第 3  章 “Preparing Custom JumpStart Installations (Tasks)”

    1. 确保将使用缺省的 class 文件来安装所有相关的 Solaris 软件包。

      请参见步骤 13

    2. 将结束脚本命名为 finish

    3. 修改 finish 脚本以安装下表中列出的软件包,这些软件包用于支持要使用的功能。

      特性 

      要安装的附加 Sun Cluster 3.2 2/08 软件包 

      RSMAPI 

      SUNWscrif

      SCI-PCI 适配器 

      • Solaris 9SUNWsci SUNWscid SUNWscidx

      • Solaris 10SUNWscir SUNWsci SUNWscidr SUNWscid

      RSMRDT 驱动程序 

      SUNWscrdt

      • 按照表中所用顺序安装软件包。

      • 安装 Solaris_arch/Product/sun_cluster/Solaris_ver/Packages/ 目录,其中,archsparcx86(仅适用于 Solaris 10),而 ver9(对于 Solaris 9)或 10(对于 Solaris 10) 中的软件包。

    4. 对希望 finish 脚本执行的其他安装后任务进行其他修改。

    5. finish 脚本复制到每个 jumpstart-dir/autoscinstall.d/nodes/node 目录中。

      为群集中的每个节点创建一个 node 目录。或者,使用此命名约定来创建指向共享 finish 脚本的符号链接。

  15. 从 JumpStart 安装服务器退出。

  16. 如果要在新群集的专用互连中使用交换机,请确保邻居发现协议 (Neighbor Discovery Protocol, NDP) 处于禁用状态。

    请按照交换机文档中的过程来确定是否启用和禁用 NDP。

    在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包, 则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。

    建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。

  17. 如果正在使用群集管理控制台,则为群集中的每个节点显示一个控制台屏幕。

    • 如果管理控制台上已安装并配置了群集控制面板 (Cluster Control Panel, CCP) 软件,请使用 cconsole(1M) 实用程序来显示各个控制台屏幕。

      以超级用户的身份使用以下命令启动 cconsole 实用程序:


      adminconsole# /opt/SUNWcluster/bin/cconsole clustername &
      

      cconsole 实用程序还将打开一个主窗口,您可以从该主窗口同时将输入发送到所有单个控制台窗口。

    • 如果未使用 cconsole 实用程序,请单独连接每个节点的控制台。

  18. 关闭各个节点。


    phys-schost# shutdown -g0 -y -i0
    
  19. 引导各节点以启动 JumpStart 安装。

    • 在基于 SPARC 的系统中执行以下操作:


      ok boot net - install
      

      注 –

      命令中破折号 (-) 的两端需加空格。


    • 在基于 x86 的系统中执行以下操作:

      1. 按任意键开始引导序列。


        Press any key to reboot.
        keystroke
        
      2. BIOS 信息屏幕一出现,就立即按 Esc+2 组合键或 F2 键。

        初始序列完成后,将出现 BIOS 设置实用程序屏幕。

      3. 在 BIOS 设置实用程序的菜单栏中,导航至“引导”菜单项。

        将显示引导设备列表。

      4. 导航至列表中与 JumpStart PXE 安装服务器连接到同一网络的 IBA,然后将其移到引导顺序的顶部。

        IBA 引导选项右侧的最低的编号对应较低的以太网端口号。IBA 引导选项右侧的较高的编号对应较高的以太网端口号。

      5. 保存所做的更改并退出 BIOS。

        引导序列将再次开始执行。进一步处理之后,屏幕上将显示 GRUB 菜单。

      6. 立即选择 Solaris JumpStart 条目,然后按 Enter 键。


        注 –

        如果 Solaris JumpStart 条目是列出的唯一条目,则也可以等待选择屏幕超时。如果您在 30 秒内不做出响应,系统将自动继续执行引导序列。



        GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
        +-------------------------------------------------------------------------+
        | Solaris_10 Jumpstart                                                    |
        |                                                                         |
        |                                                                         |
        +-------------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press enter to boot the selected OS, 'e' to edit the
        commands before booting, or 'c' for a command-line.

        进一步处理之后,屏幕上将显示安装类型菜单。

      7. 在安装类型菜单中,立即键入“定制 JumpStart”对应的菜单编号。


        注 –

        如果在 30–秒超时时限到达之前没有键入“定制 JumpStart”对应的编号,系统将自动开始进行 Solaris 交互式安装。



              Select the type of installation you want to perform:
        
                 1 Solaris Interactive
                 2 Custom JumpStart
                 3 Solaris Interactive Text (Desktop session)
                 4 Solaris Interactive Text (Console session)
                 5 Apply driver updates
                 6 Single user shell
        
                 Enter the number of your choice.
        2
        

        JumpStart 将在每个节点上安装 Solaris 操作系统和 Sun Cluster 软件。当安装成功完成时,每个节点被完全安装为一个新的群集节点。安装 Sun Cluster 的输出信息记录在 /var/cluster/logs/install/scinstall.log. N 文件中。

      8. 当 BIOS 屏幕再次出现时,立即按 Esc+2 组合键或 F2 键。


        注 –

        如果此时不中断 BIOS,它将自动返回到安装类型菜单。如果 30 秒内不在该菜单中键入任何选项,系统将自动开始进行交互式安装。


        进一步处理之后,将显示 BIOS 设置实用程序。

      9. 在菜单栏中导航至“引导”菜单。

        将显示引导设备列表。

      10. 导航至“硬盘驱动器”条目并将其重新移至引导顺序的顶部。

      11. 保存所做的更改并退出 BIOS。

        引导序列将再次开始执行。无需在 GRUB 菜单中执行任何进一步的交互操作,即可完成引导至群集模式中的过程。

  20. 对于 Solaris 10 OS,请在每个节点上检验服务器管理工具 (Service Management Facility, SMF) 的多用户服务是否联机。

    如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。


    phys-schost# svcs multi-user-server node
    STATE          STIME    FMRI
    online         17:52:55 svc:/milestone/multi-user-server:default
  21. 如果要将新节点安装到现有的群集,请在新节点上为所有现有群集文件系统创建挂载点。

    1. 从群集的另一个活动节点上,显示所有群集文件系统的名称。


      phys-schost# mount | grep global | egrep -v node@ | awk '{print $1}'
      
    2. 在添加到群集的节点上,为群集中的每个群集文件系统创建挂载点。


      phys-schost-new# mkdir -p mountpoint
      

      例如,如果由安装命令返回的文件系统名称为 /global/dg-schost-1,请在正被添加到群集中的节点上运行 mkdir -p /global/dg-schost-1


      注 –

      当您在步骤 25 中重新引导群集之后,这些挂载点将成为活动挂载点。


    3. 如果群集中的任何节点上安装了 VERITAS 卷管理器 (VxVM),请在已安装 VxVM 的每个节点上查看 vxio 编号。


      phys-schost# grep vxio /etc/name_to_major
      vxio NNN
      
      • 确保在安装了 VxVM 的每个节点上都使用相同的 vxio 编号。

      • 确保 vxio 编号在每个未安装 VxVM 的节点上都可用。

      • 如果未安装 VxVM 的节点上已经使用了 vxio 编号,请在该节点上释放此编号。更改 /etc/name_to_major 条目以使用其它编号。

  22. (可选的)要在 Sun Enterprise 10000 服务器上使用动态重新配置,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    set kernel_cage_enable=1

    此条目在下次重新引导系统后生效。有关执行 Sun Cluster 配置中的动态重新配置任务的过程,请参见《Sun Cluster 系统管理指南(适用于 Solaris OS)》。有关动态重新配置的更多信息,请参见服务器文档。

  23. 如果要在具有高可用性的本地文件系统上使用 Sun Cluster HA for NFS,请确保禁用回送文件系统 (loopback file system, LOFS) 。

    要禁用 LOFS,请将以下条目添加到群集中每个节点上的 /etc/system 文件中。


    exclude:lofs

    /etc/system 文件所做的更改将在下次重新引导系统后生效。


    注 –

    如果在具有高可用性的本地文件系统中使用 Sun Cluster HA for NFS 并且 automountd 正在运行,则不能启用 LOFS。LOFS 会导致 Sun Cluster HA for NFS 出现切换转移问题。如果选择在具有高可用性的本地文件系统上添加 Sun Cluster HA for NFS,则必须进行以下配置更改之一。

    但是,如果要在群集中配置非全局区域,则必须在所有的群集节点上启用 LOFS。如果高可用本地文件系统上的 Sun Cluster HA for NFS 必须与 LOFS 共存,则只能放弃对 LOFS 的禁用改用他法。

    • 禁用 LOFS。

    • 禁用 automountd 守护进程。

    • 从自动安装程序映射中排除属于由 Sun Cluster HA for NFS 导出的具有高可用性的本地文件系统的所有文件。这样做可以使 LOFS 和 automountd 守护进程都保持启用状态。


    有关回送文件系统的更多信息,请参见《系统管理指南:设备和文件系统》Solaris 9Solaris 10)中的“回送文件系统”

  24. x86: 设置默认的引导文件。

    如果无法访问登录提示,该值的设置使您能够重新引导节点。

    • 在 Solaris 9 OS 上,将默认值设置为 kadb


      phys-schost# eeprom boot-file=kadb
      
    • 在 Solaris 10 OS 上,在 GRUB 引导参数菜单中将默认值设置为 kmdb


      grub edit> kernel /platform/i86pc/multiboot kmdb
      
  25. 如果执行需要重新引导群集的任务,请按照以下步骤重新引导群集。

    以下是一些需要重新引导的任务:

    • 向现有群集中添加新节点

    • 安装需要重新引导节点或群集的修补程序

    • 对配置进行需要重新引导以便激活的更改

    1. 在一个节点上成为超级用户。

    2. 关闭群集。


      phys-schost-1# cluster shutdown -y -g0 clustername
      

      注 –

      只能等到群集关闭之后才能重新引导群集中第一个安装的节点。禁用群集安装模式前,只有建立群集的第一个安装节点才有定额选票。在建立的仍处于安装模式的群集中,如果在重新引导第一个安装的节点前未关闭群集,其余群集节点将无法获得定额选票。然后整个群集将关闭。

      群集节点会一直处在安装模式下,直到您首次运行 clsetup 命令为止。将在执行如何配置法定设备过程期间运行此命令。


    3. 重新引导群集中的每个节点。

      • 在基于 SPARC 的系统中执行以下操作:


        ok boot
        
      • 在基于 x86 的系统中执行以下操作:

        显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


        GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
        +-------------------------------------------------------------------------+
        | Solaris 10 /sol_10_x86                                                  |
        | Solaris failsafe                                                        |
        |                                                                         |
        +-------------------------------------------------------------------------+
        Use the ^ and v keys to select which entry is highlighted.
        Press enter to boot the selected OS, 'e' to edit the
        commands before booting, or 'c' for a command-line.

        有关基于 GRUB 进行引导的更多信息,请参见《System Administration Guide: Basic Administration》中的第 11  章 “GRUB Based Booting (Tasks)”

    scinstall 实用程序用于安装和配置所有群集节点并重新引导群集。将所有节点成功引导到群集中之后,即建立了群集。安装 Sun Cluster 的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。

  26. (可选的)如果没有执行步骤 25 来重新引导节点,请在每个节点上手动启动 Sun Java Web Console Web 服务器。


    phys-schost# smcwebserver start
    

    有关更多信息,请参见 smcwebserver(1M) 手册页。

  27. 在一个节点上成为超级用户。

  28. 检验所有节点是否都已加入群集。


    phys-schost# clnode status
    

    输出类似于以下内容。


    === Cluster Nodes ===
    
    --- Node Status ---
    
    Node Name                                       Status
    ---------                                       ------
    phys-schost-1                                   Online
    phys-schost-2                                   Online
    phys-schost-3                                   Online

    有关更多信息,请参见 clnode(1CL) 手册页。

  29. (可选的)在每个节点上,启用当所有受监视的磁盘路径都发生故障时的节点自动重新引导功能。

    1. 启用自动重新引导功能。


      phys-schost# clnode set -p reboot_on_path_failure=enabled 
      
      -p

      指定要设置的属性

      reboot_on_path_failure=enable

      指定当所有受监视的磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则节点将重新引导。

    2. 检验是否启用了磁盘路径发生故障时的自动重新引导功能。


      phys-schost# clnode show
      === Cluster Nodes ===                          
      
      Node Name:                                      node
      …
        reboot_on_path_failure:                          enabled
      …
接下来的操作

如果向双节点群集中添加了节点,请转至如何在向群集中添加节点后更新法定设备

否则,转至下一个相应过程:

故障排除

禁用的 scinstall 选项-如果 scinstall 命令中 JumpStart 选项的开头没有星号,则表示该选项被禁用。这种状况表明 JumpStart 安装未完成或安装出错。要解决这种情况,请先退出 scinstall 实用程序。重复执行步骤 1步骤 14 以更正 JumpStart 设置,然后重新启动 scinstall 实用程序。

关于不存在节点的错误消息-除非安装了您自己的 /etc/inet/ntp.conf 文件,否则 scinstall 命令将安装默认的 ntp.conf 文件。默认文件包含在最大数量的节点的参考中。因此,xntpd(1M) 守护进程可能会在引导时发出关于某些参考的错误消息。可以忽略这些消息。有关如何在其他群集条件都正常的情况下抑制这些消息的信息,请参见如何配置网络时间协议 (NTP)