Sun Cluster 系统管理指南(适用于 Solaris OS)

第 3 章 关闭和引导群集

本章介绍了关闭和引导全局群集、区域群集及单个群集节点的相关信息和具体过程。有关引导非全局区域的信息,请参见《系统管理指南:Solaris Containers-资源管理和 Solaris Zones》中的第 18  章 “规划和配置非全局区域(任务)”

有关本章中相关过程的较高层面的说明,请参见如何以非群集模式引导节点表 3–2

关闭和引导群集概述

Sun Cluster cluster(1CL) shutdown 命令按顺序停止全局群集服务并完全关闭整个全局群集。您可以在移动全局群集的位置时使用 cluster shutdown 命令,或者在应用程序错误导致数据损坏时关闭全局群集。clzonecluster halt 命令停止在特定节点上运行的区域群集或所有已配置节点上的整个区域群集。(还可以在区域群集内使用 cluster shutdown 命令。)

在本章的操作过程中,phys-schost# 表示全局群集提示符。clzonecluster 交互式 shell 提示符为 clzc:schost>


注 –

使用 cluster shutdown 命令可确保正确关闭整个全局群集。Solaris shutdownclnode(1CL) evacuate 命令一起使用可关闭单个节点。有关更多信息,请参见如何关闭群集关闭和引导群集中的单个节点


cluster shutdownclzonecluster halt 命令可通过执行下列操作分别停止全局群集或区域群集中的所有节点:

  1. 使所有正在运行的资源组脱机。

  2. 卸载全局群集或区域群集的所有群集文件系统。

  3. cluster shutdown 命令用于关闭全局群集或区域群集上的活动设备服务。

  4. cluster shutdown 命令运行 init 0,并使群集上的所有节点均显示 OpenBootTM PROM ok 提示符(在基于 SPARC 的系统上)或在 GRUB 菜单中显示消息 "Press any key to continue"(在基于 x86 的系统上)。有关 GRUB 菜单的详细说明,请参见《系统管理指南:基本管理》中的“使用 GRUB 引导基于 x86 的系统(任务图)”clzonecluster halt 命令执行 zoneadm - z zoneclustername halt 命令以停止(但不是关闭)区域群集的区域。


注 –

根据需要,您可以在非群集模式下引导节点,这样,节点便不是群集成员。非群集模式在安装群集软件或执行某些管理过程时很有用。有关更多信息,请参见如何以非群集模式引导节点


表 3–1 任务列表:关闭和引导群集

任务 

指导 

停止群集。 

如何关闭群集

通过引导所有节点来启动群集。节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

如何引导群集

重新引导群集。 

如何重新引导群集

Procedure如何关闭群集

您可以关闭全局群集、一个区域群集或所有区域群集。


注意 – 注意 –

不要在群集控制台上使用 send brk 来关闭全局群集节点或区域群集节点。群集内部不支持该命令。


phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B

  1. 如果您的全局群集或区域群集正在运行 Oracle Real Application Clusters (RAC),请关闭您要关闭的群集上的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在群集中的任一节点上,成为超级用户或使用一个可提供 solaris.cluster.admin RBAC 授权的角色。从全局群集中的某个节点执行此过程中的所有步骤。

  3. 关闭全局群集、一个区域群集或所有区域群集。

    • 关闭全局群集。此操作还会关闭所有区域群集。


      phys-schost# cluster shutdown -g0 -y
      
    • 关闭特定的区域群集。


      phys-schost# clzonecluster halt zoneclustername
      
    • 关闭所有区域群集。


      phys-schost# clzonecluster halt +
      

      还可以在区域群集内使用 cluster shutdown 命令来关闭所有区域群集。

  4. 确认全局群集或区域群集上的所有节点都显示 ok 提示符(在基于 SPARC 的系统上)或显示 GRUB 菜单(在基于 x86 的系统上)。

    除非所有节点均显示 ok 提示符(在基于 SPARC 的系统上)或均处于引导子系统中(在基于 x86 的系统上),否则请勿关闭任何节点的电源。

    • 确认全局群集节点显示 ok 提示符(在基于 SPARC 的系统上)或消息 "Press any key to continue"(在基于 GRUB 的 x86 系统上)。


      phys-schost# cluster status -t node
      
    • 使用 status 子命令检验该区域群集是否已关闭。


      phys-schost# clzonecluster status
      
  5. 如有必要,请关闭全局群集节点的电源。


示例 3–1 关闭区域群集

以下示例关闭了一个名为 sparse-sczone 的区域群集。


phys-schost# clzonecluster halt sparse-sczone
Waiting for zone halt commands to complete on all the nodes of the zone cluster "sparse-sczone"...
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 2 of cluster 'sparse-sczone' died.
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 4 of cluster 'sparse-sczone' died.
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' died.
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 1 of cluster 'sparse-sczone' died.
phys-schost# 


示例 3–2 SPARC: 关闭全局群集

以下示例显示了当系统停止正常的全局群集操作并关闭所有节点以显示 ok 提示符时控制台的输出。-g 0 选项表示将关闭宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也会显示关闭消息。


phys-schost# cluster shutdown -g0 -y
Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 
WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok 


示例 3–3 x86: 关闭全局群集

以下示例显示了当系统停止正常的全局群集操作并关闭所有节点时控制台的输出。在该示例中,没有在所有节点上均显示 ok 提示符。-g 0 选项表示将关闭宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也会显示关闭消息。


phys-schost# cluster shutdown -g0 -y
May  2 10:32:57 phys-schost-1 cl_runtime: 
WARNING: CMM: Monitoring disabled.  
root@phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
failfasts already disabled on node 1
Print services already stopped.
May  2 10:33:13 phys-schost-1 syslogd: going down on signal 15
The system is down.
syncing file systems... done
Type any key to continue 

另请参见

要重新启动已经关闭的全局群集或区域群集,请参见如何引导群集

Procedure如何引导群集

该过程说明了如何启动节点已经关闭的全局群集或区域群集。对于全局群集节点,系统显示 ok 提示符(在 SPARC 系统上)或消息 “Press any key to continue”(在基于 GRUB 的 x86 系统上)。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B


注 –

要创建区域群集,请按照《Sun Cluster 软件安装指南(适用于 Solaris OS)》中的“配置区域群集”中的说明操作。


  1. 将每个节点都引导到群集模式下。从全局群集的节点执行此过程中的所有步骤。

    • 在基于 SPARC 的系统上,运行以下命令。


      ok boot
      
    • 在基于 x86 的系统上,运行以下命令。

      显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


      GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
      +-------------------------------------------------------------------------+
      | Solaris 10 /sol_10_x86                                                  |
      | Solaris failsafe                                                        |
      |                                                                         |
      +-------------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press enter to boot the selected OS, 'e' to edit the
      commands before booting, or 'c' for a command-line.

      有关基于 GRUB 的引导的更多信息,请参见《系统管理指南:基本管理》中的“使用 GRUB 引导基于 x86 的系统(任务图)”


      注 –

      节点必须具有到群集互连的有效连接才能获得群集成员的身份。


    • 如果您具有一个区域群集,便可以引导整个区域群集。


      phys-schost# clzonecluster boot zoneclustername
      
    • 如果您具有多个区域群集,便可以引导所有区域群集。请使用 + 代替 zoneclustername

  2. 验证引导节点时未发生错误,而且节点现在处于联机状态。

    cluster(1CL) status 命令报告全局群集节点的状态。


    phys-schost# cluster status -t node
    

    当您从全局群集节点运行 clzonecluster(1CL) status 命令时,该命令将报告区域群集节点的状态。


    phys-schost# clzonecluster status
    

    注 –

    如果节点的 /var 文件系统已满,可能无法在该节点上重新启动 Sun Cluster。如果出现该问题,请参见如何修复已满的 /var 文件系统



示例 3–4 SPARC: 引导全局群集

以下示例显示了将节点 phys-schost-1 引导到全局群集后的控制台输出。全局群集中其他节点的控制台上会显示类似的消息。当某个区域群集的自动引导属性设置为 true 时,系统将在引导该计算机上的全局群集节点之后自动引导该区域群集节点。

当全局群集节点重新引导时,该计算机上的所有区域群集节点都将停止。在该全局群集节点重新启动之后,将引导同一计算机上自动引导属性设置为 true 的任何区域群集节点。


ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node phys-schost-1 with votecount = 1 added.
NOTICE: Node phys-schost-2 with votecount = 1 added.
NOTICE: Node phys-schost-3 with votecount = 1 added.
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-2 (incarnation # 937690106) has become reachable.
NOTICE: Node phys-schost-3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node phys-schost-1 is up; new incarnation number = 937846227.
NOTICE: node phys-schost-2 is up; new incarnation number = 937690106.
NOTICE: node phys-schost-3 is up; new incarnation number = 937690290.
NOTICE: Cluster members: phys-schost-1 phys-schost-2 phys-schost-3.
...

Procedure如何重新引导群集

要关闭全局群集,请运行 cluster shutdown 命令,然后在每个节点上使用 boot 命令引导全局群集。要关闭区域群集,请使用 clzonecluster halt 命令,然后使用 clzonecluster boot 命令引导该区域群集。您还可以使用 clzonecluster reboot 命令。有关更多信息,请参见 cluster(1CL)boot(1M)clzonecluster(1CL) 手册页。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B

  1. 如果您的群集正在运行 Oracle RAC,请关闭您要关闭的群集中的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在群集中的任一节点上,成为超级用户或使用一个可提供 solaris.cluster.admin RBAC 授权的角色。从全局群集中的某个节点执行此过程中的所有步骤。

  3. 关闭群集。

    • 关闭全局群集。


      phys-schost# cluster shutdown -g0 -y 
      
    • 如果您具有区域群集,请从全局群集节点关闭该区域群集。


      phys-schost# clzonecluster halt zoneclustername
      

    将关闭所有节点。还可以在区域群集内使用 cluster shutdown 命令来关闭该区域群集。


    注 –

    节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 引导每个节点。

    除非在两次关闭操作之间更改了配置,否则,节点的引导顺序无关紧要。如果在两次关闭操作之间进行了配置更改,则首先启动具有最新配置的节点。

    • 对于基于 SPARC 的系统上的全局群集节点,请运行以下命令。


      ok boot
      
    • 对于基于 x86 的系统上的全局群集节点,请运行以下命令。

      显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


      GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
      +-------------------------------------------------------------------------+
      | Solaris 10 /sol_10_x86                                                  |
      | Solaris failsafe                                                        |
      |                                                                         |
      +-------------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press enter to boot the selected OS, 'e' to edit the
      commands before booting, or 'c' for a command-line.

    注 –

    节点必须具有到群集互连的有效连接才能获得群集成员的身份。


    有关基于 GRUB 的引导的更多信息,请参见《系统管理指南:基本管理》中的“使用 GRUB 引导基于 x86 的系统(任务图)”

    • 对于区域群集,请在全局群集的单个节点上键入以下命令来引导该区域群集。


      phys-schost# clzonecluster boot zoneclustername
      

    当群集组件被激活时,所引导的节点的控制台上将显示消息。

  5. 验证引导节点时未发生错误,而且节点现在处于联机状态。

    • clnode status 命令报告全局群集中节点的状态。


      phys-schost# clnode status
      
    • 在全局群集节点上运行 clzonecluster status 命令将报告区域群集节点的状态。


      phys-schost# clzonecluster status
      

      还可以在区域群集内运行 cluster status 命令来查看节点的状态。


      注 –

      如果节点的 /var 文件系统已满,可能无法在该节点上重新启动 Sun Cluster。如果出现该问题,请参见如何修复已满的 /var 文件系统



示例 3–5 重新引导区域群集

以下示例显示了如何停止和引导一个名为 sparse-sczone 的区域群集。您还可以使用 clzonecluster reboot 命令。


phys-schost# clzonecluster halt sparse-sczone
Waiting for zone halt commands to complete on all the nodes of the zone cluster "sparse-sczone"...
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 4 of cluster 'sparse-sczone' died.
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 2 of cluster 'sparse-sczone' died.
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 1 of cluster 'sparse-sczone' died.
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' died.
phys-schost#
phys-schost# clzonecluster boot sparse-sczone
Waiting for zone boot commands to complete on all the nodes of the zone cluster "sparse-sczone"...
phys-schost# Sep  5 19:18:23 schost-4  cl_runtime: NOTICE: Membership : Node 1 of cluster
 'sparse-sczone' joined.
Sep  5 19:18:23 schost-4 cl_runtime: NOTICE: Membership : Node 2 of cluster 'sparse-sczone' joined.
Sep  5 19:18:23 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' joined.
Sep  5 19:18:23 schost-4 cl_runtime: NOTICE: Membership : Node 4 of cluster 'sparse-sczone' joined.

phys-schost#
phys-schost# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---

Name            Node Name   Zone HostName   Status   Zone Status
----            ---------   -------------   ------   -----------
sparse-sczone   schost-1    sczone-1        Online   Running
                schost-2    sczone-2        Online   Running
                schost-3    sczone-3        Online   Running
                schost-4    sczone-4        Online   Running
phys-schost# 


示例 3–6 SPARC: 重新引导全局群集

以下示例显示了当停止正常的全局群集操作、所有节点均关闭以显示 ok 提示符并且全局群集重新启动时的控制台输出。-g 0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也会显示关闭消息。


phys-schost# cluster shutdown -g0 -y
Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 
WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-2 (incarnation # 937690106) has become reachable.
NOTICE: Node phys-schost-3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members: phys-schost-1 phys-schost-2 phys-schost-3.
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: 

关闭和引导群集中的单个节点

您可以关闭全局群集节点、区域群集节点或非全局区域。本节说明了如何关闭全局群集节点和区域群集节点。

要关闭全局群集节点,应同时使用 clnode evacuate 命令和 Solaris shutdown 命令。仅当关闭整个全局群集时,才能使用 cluster shutdown 命令。

对于区域群集节点,请在全局群集中使用 clzonecluster halt 命令以关闭单个区域群集节点或整个区域群集。还可以使用 clnode evacuateshutdown 命令来关闭区域群集节点。

有关关闭和引导非全局区域的信息,请参见《系统管理指南:Solaris Containers-资源管理和 Solaris Zones》中的第 20  章 “安装、引导、停止、卸载和克隆非全局区域(任务)”。另请参见 clnode(1CL)shutdown(1M)clzonecluster(1CL)

在本章的操作过程中,phys-schost# 表示全局群集提示符。clzonecluster 交互式 shell 提示符为 clzc:schost>

表 3–2 任务图:关闭并引导节点

任务 

工具 

指导 

停止节点。 

对于全局群集节点,请使用 clnode(1CL) evacuateshutdown。 对于区域群集节点,请使用 clzonecluster(1CL) halt

如何关闭节点

启动节点。 

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

对于全局群集节点,请使用 bootb。 对于区域群集节点,请使用 clzonecluster(1CL) boot

如何引导节点

停止并重新启动(重新引导)群集中的节点。 

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

对于全局群集节点,请使用 clnode evacuateshutdown,然后使用 bootb

对于区域群集节点,请使用 clzonecluster(1CL) reboot

如何重新引导节点

引导一个节点,使该节点不成为群集成员。 

对于全局群集节点,请使用 clnode evacuateshutdown 命令,然后使用 boot -x (在 SPARC 上)或 GRUB 菜单项编辑(在 x86 上)。

如果底层的全局群集是以非群集模式引导的,则区域群集节点也自动以非群集模式引导。  

如何以非群集模式引导节点

Procedure如何关闭节点

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B


注意 – 注意 –

不要在群集控制台上使用 send brk 来关闭全局群集或区域群集上的节点。群集内部不支持该命令。


  1. 如果您的群集正在运行 Oracle RAC,请关闭您要关闭的群集中的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在要关闭的群集节点上,成为超级用户或使用一个可提供 solaris.cluster.admin RBAC 授权的角色。从全局群集中的某个节点执行此过程中的所有步骤。

  3. 如果您想要停止特定的区域群集成员,请跳过步骤 4-6,然后从全局群集节点执行以下命令:


    phys-schost# clzonecluster halt -n physical-name zoneclustername
    

    如果您指定了特定的区域群集节点,将仅停止该节点。默认情况下,halt 命令停止所有节点上的区域群集。

  4. 将所有资源组、资源和设备组从要关闭的节点切换到其他全局群集成员。

    在要关闭的全局群集节点上,键入以下命令。clnode evacuate 命令可将指定节点上的所有资源组和设备组(包括所有非全局区域)切换到下一个首选节点。(还可以在区域群集节点内运行 clnode evacuate。)


    phys-schost# clnode evacuate node
    
    node

    指定从中切换资源组和设备组的节点。

  5. 关闭该节点。

    指定您想要关闭的全局群集节点。


    phys-schost# shutdown -g0 -y -i0
    

    检验该全局群集节点是否显示 ok 提示符(在基于 SPARC 的系统上)或在 GRUB 菜单中显示消息 "Press any key to continue"(在基于 x86 的系统上)。

  6. 如有必要,请关闭节点电源。


示例 3–7 SPARC: 关闭全局群集节点

以下示例显示了当节点 phys-schost-1 关闭时的控制台输出。-g0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也显示此节点的关闭消息。


phys-schost# clnode evacuate nodename
phys-schost# shutdown -g0 -y
Wed Mar 10 13:47:32 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
Program terminated
ok 


示例 3–8 x86: 关闭全局群集节点

以下示例显示了当节点 phys-schost-1 关闭时的控制台输出。-g0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也显示此节点的关闭消息。


phys-schost# clnode evacuate phys-schost-1
phys-schost# shutdown -g0 -y
Shutdown started.    Wed Mar 10 13:47:32 PST 2004

Changing to init state 0 - please wait
Broadcast Message from root (console) on phys-schost-1 Wed Mar 10 13:47:32... 
THE SYSTEM phys-schost-1 IS BEING SHUT DOWN NOW ! ! !
Log off now or risk your files being damaged

phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
failfasts disabled on node 1
Print services already stopped.
Mar 10 13:47:44 phys-schost-1 syslogd: going down on signal 15
umount: /global/.devices/node@2 busy
umount: /global/.devices/node@1 busy
The system is down.
syncing file systems... done
WARNING: CMM: Node being shut down.
Type any key to continue 


示例 3–9 关闭区域群集节点

以下示例显示了如何使用 clzonecluster halt 关闭一个名为 sparse-sczone 的区域群集中的节点。(还可以在区域群集节点中运行 clnode evacuateshutdown 命令。)


phys-schost# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---

Name            Node Name   Zone HostName   Status   Zone Status
----            ---------   -------------   ------   -----------
sparse-sczone   schost-1    sczone-1        Online   Running
                schost-2    sczone-2        Online   Running
                schost-3    sczone-3        Online   Running
                schost-4    sczone-4        Online   Running

phys-schost#
phys-schost# clzonecluster halt -n schost-4 sparse-sczone
Waiting for zone halt commands to complete on all the nodes of the zone cluster "sparse-sczone"...
Sep  5 19:24:00 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' died.
phys-host#
phys-host# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---

Name            Node Name   Zone HostName   Status    Zone Status
----            ---------   -------------   ------    -----------
sparse-sczone   schost-1    sczone-1        Online    Running
                schost-2    sczone-2        Online    Running
                schost-3    sczone-3        Offline   Installed
                schost-4    sczone-4        Online    Running

phys-schost# 

另请参见

要重新启动已关闭的全局群集节点,请参见如何引导节点

Procedure如何引导节点

如果打算关闭或重新引导全局群集或区域群集中的其他活动节点,请等到要引导的节点至少处于以下状态:

否则,该节点将无法从群集中要关闭或重新引导的其他节点那里接管服务。有关引导非全局区域的信息,请参见《系统管理指南:Solaris Containers-资源管理和 Solaris Zones》中的第 20  章 “安装、引导、停止、卸载和克隆非全局区域(任务)”


注 –

节点的启动可能受法定配置的影响。在双节点群集中,必须配置一个定额设备,使群集中的定额总计数为三。每个节点应有一个定额计数,定额设备有一个定额计数。在这种情况下,当第一个节点关闭后,第二个节点仍然具有法定,并且以唯一的群集成员的身份运行。要使第一个节点作为群集节点返回群集,第二个节点必须启动并且正在运行。必须存在所需的群集定额计数(两个)。


phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B


注 –

节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  1. 要启动已关闭的全局群集节点或区域群集节点,请引导该节点。从全局群集中的某个节点执行此过程中的所有步骤。

    • 在基于 SPARC 的系统上,运行以下命令。


      ok boot
      
    • 在基于 x86 的系统上,运行以下命令。

      显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


      GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
      +-------------------------------------------------------------------------+
      | Solaris 10 /sol_10_x86                                                  |
      | Solaris failsafe                                                        |
      |                                                                         |
      +-------------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press enter to boot the selected OS, 'e' to edit the
      commands before booting, or 'c' for a command-line.

      当群集组件被激活时,所引导的节点的控制台上将显示消息。

    • 如果您具有区域群集,可以指定要引导的节点。


      phys-schost# clzonecluster boot -n node zoneclustername
      
  2. 确认引导该节点时未发生错误,而且该节点现在处于联机状态。

    • 运行 cluster status 命令可报告全局群集节点的状态。


      phys-schost# cluster status -t node
      
    • 从全局群集中的节点运行 clzonecluster status 命令可报告所有区域群集节点的状态。


      phys-schost# clzonecluster status
      

      当托管区域群集节点的节点以群集模式引导时,区域群集节点只能以群集模式引导。


      注 –

      如果节点的 /var 文件系统已满,可能无法在该节点上重新启动 Sun Cluster。如果出现该问题,请参见如何修复已满的 /var 文件系统



示例 3–10 SPARC: 引导全局群集节点

以下示例显示了将节点 phys-schost-1 引导到全局群集后的控制台输出。


ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

Procedure如何重新引导节点

要关闭或重新引导全局群集或区域群集中的其他活动节点,请等到要重新引导的节点至少达到以下状态:

否则,该节点将无法从群集中要关闭或重新引导的其他节点那里接管服务。有关重新引导非全局区域的信息,请参见《系统管理指南:Solaris Containers-资源管理和 Solaris Zones》中的第 20  章 “安装、引导、停止、卸载和克隆非全局区域(任务)”

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B

  1. 如果全局群集或区域群集节点正在运行 Oracle RAC,请关闭您要关闭的节点上的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在要关闭的节点上,成为超级用户或使用一个可提供 solaris.cluster.admin RBAC 授权的角色。从全局群集中的某个节点执行此过程中的所有步骤。

  3. 使用 clnode evacuateshutdown 命令关闭全局群集节点。使用在全局群集的某个节点上执行的 clzonecluster halt 命令关闭区域群集。(clnode evacuateshutdown 命令也可用于区域群集。)

    对于全局群集,请在节点上键入以下命令将其关闭。clnode evacuate 命令可将指定节点上的所有设备组切换到下一个首选节点。此外,该命令还可将所有资源组从指定节点的全局或非全局区域切换到位于其他节点的下一个首选全局或非全局区域。

    • 在基于 SPARC 的系统上,运行以下命令。


      phys-schost# clnode evacuate node
      

      phys-schost# shutdown -g0 -y -i6
      
    • 在基于 x86 的系统上,运行以下命令。


      phys-schost# clnode evacuate node
      

      phys-schost# shutdown -g0 -y -i6
      

      显示 GRUB 菜单后,选择相应的 Solaris 条目,然后按 Enter 键。GRUB 菜单显示如下内容:


      GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
      +-------------------------------------------------------------------------+
      | Solaris 10 /sol_10_x86                                                  |
      | Solaris failsafe                                                        |
      |                                                                         |
      +-------------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press enter to boot the selected OS, 'e' to edit the
      commands before booting, or 'c' for a command-line.
    • 指定要关闭和重新引导的区域群集节点。


      phys-schost# clzonecluster reboot - node zoneclustername
      

    注 –

    节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 确认引导该节点时未发生错误,而且该节点现在处于联机状态。

    • 确认全局群集节点处于联机状态。


      phys-schost# cluster status -t node
      
    • 确认区域群集节点处于联机状态。


      phys-schost# clzonecluster status
      

示例 3–11 SPARC: 重新引导全局群集节点

以下示例显示了当节点 phys-schost-1 重新引导时的控制台输出。有关该节点的消息(例如关闭和启动通知)出现在全局群集中其他节点的控制台上。


phys-schost# clnode evacuate phys-schost-1
phys-schost# shutdown -g0 -y -i6
Shutdown started.    Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 

WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 6
The system is coming down.  Please wait.
System services are now being stopped.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
rebooting...
Resetting ... 
,,,
Sun Ultra 1 SBus (UltraSPARC 143MHz), No Keyboard
OpenBoot 3.11, 128 MB memory installed, Serial #5932401.
Ethernet address 8:8:20:99:ab:77, Host ID: 8899ab77.
...
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
The system is ready.
phys-schost-1 console login: 


示例 3–12 x86: 重新引导全局群集节点

以下示例显示了重新引导节点 phys-schost-1 时的控制台输出。有关该节点的消息(例如关闭和启动通知)出现在全局群集中其他节点的控制台上。


phys-schost# clnode evacuate phys-schost-1
phys-schost # shutdown -y -g0 -i6

GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
+-------------------------------------------------------------------------+
| Solaris 10 /sol_10_x86                                                  |
| Solaris failsafe                                                        |
|                                                                         |
+-------------------------------------------------------------------------+
Use the ^ and v keys to select which entry is highlighted.
Press enter to boot the selected OS, 'e' to edit the
commands before booting, or 'c' for a command-line.
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: 


示例 3–13 重新引导区域群集节点

以下示例显示了如何重新引导区域群集中的节点。


phys-schost# clzonecluster reboot -n schost-4 sparse-sczone
Waiting for zone reboot commands to complete on all the nodes of the zone cluster "sparse-sczone"...
Sep  5 19:40:59 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' died.
phys-schost# Sep  5 19:41:27 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' joined.

phys-schost#
phys-schost# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---
Name            Node Name   Zone HostName   Status   Zone Status
----            ---------   -------------   ------   -----------
sparse-sczone   schost-1    sczone-1        Online   Running
                schost-2    sczone-2        Online   Running
                schost-3    sczone-3        Online   Running
                schost-4    sczone-4        Online   Running

phys-schost#

Procedure如何以非群集模式引导节点

可以在非群集模式下引导全局群集节点,此时该节点不会成为群集的成员。当安装群集软件或执行某些管理过程(如修补节点)时,非群集模式很有用。区域群集节点不能处于与底层的全局群集节点的状态不同的引导状态。如果底层的全局群集节点是以非群集模式引导的,则区域群集节点也自动处于非群集模式。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Sun Cluster 命令的长格式。此外,大多数命令还有简短格式。这些命令除了名称长短的不同以外,其功能都是相同的。有关命令及其简短格式的列表,请参见附录 B

  1. 在将要以非群集模式启动的群集上,成为超级用户或使用一个可提供 solaris.cluster.admin RBAC 授权的角色。从全局群集中的某个节点执行此过程中的所有步骤。

  2. 通过在全局群集的节点中运行 clzonecluster halt 命令关闭区域群集节点。使用 clnode evacuateshutdown 命令关闭全局群集节点。

    clnode evacuate 命令可将指定节点上的所有设备组切换到下一个首选节点。此外,该命令还可将所有资源组从指定节点的全局或非全局区域切换到位于其他节点的下一个首选全局或非全局区域。

    • 关闭特定的全局群集。


      phys-schost# clnode evacuate node
      

      phys-schost# shutdown -g0 -y
      
    • 从全局群集节点关闭特定的区域群集节点。


      phys-schost# clzonecluster halt -n node zoneclustername
      

      还可以在区域群集内使用 clnode evacuateshutdown 命令。

  3. 确认全局群集节点显示 ok 提示符(在基于 Solaris 的系统上)或在 GRUB 菜单中显示消息 "Press any key to continue"(在基于 x86 的系统上)。

  4. 以非群集模式引导全局群集节点。

    • 在基于 SPARC 的系统上,运行以下命令。


      ok boot -xs
      
    • 在基于 x86 的系统上,运行以下命令。

    1. 在 GRUB 菜单中,使用方向键选择适当的 Solaris 条目,然后键入 e 编辑其命令。

      GRUB 菜单显示如下内容:


      GNU GRUB version 0.95 (631K lower / 2095488K upper memory)
      +-------------------------------------------------------------------------+
      | Solaris 10 /sol_10_x86                                                  |
      | Solaris failsafe                                                        |
      |                                                                         |
      +-------------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press enter to boot the selected OS, 'e' to edit the
      commands before booting, or 'c' for a command-line.

      有关基于 GRUB 的引导的更多信息,请参见《系统管理指南:基本管理》中的“使用 GRUB 引导基于 x86 的系统(任务图)”

    2. 在引导参数屏幕中,使用方向键选择内核条目,然后键入 e 编辑该条目。

      GRUB 引导参数屏幕的显示与以下内容类似:


      GNU GRUB version 0.95 (615K lower / 2095552K upper memory)
      +----------------------------------------------------------------------+
      | root (hd0,0,a)                                                       |
      | kernel /platform/i86pc/multiboot                                     |
      | module /platform/i86pc/boot_archive                                  |
      +----------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press 'b' to boot, 'e' to edit the selected command in the
      boot sequence, 'c' for a command-line, 'o' to open a new line
      after ('O' for before) the selected line, 'd' to remove the
      selected line, or escape to go back to the main menu.
    3. 在命令中添加 -x 以指定将系统引导至非群集模式。


      [ Minimal BASH-like line editing is supported. For the first word, TAB
      lists possible command completions. Anywhere else TAB lists the possible
      completions of a device/filename. ESC at any time exits. ]
      
      grub edit> kernel /platform/i86pc/multiboot -x
    4. 按 Enter 键接受所做更改,并返回到引导参数屏幕。

      屏幕将显示编辑后的命令。


      GNU GRUB version 0.95 (615K lower / 2095552K upper memory)
      +----------------------------------------------------------------------+
      | root (hd0,0,a)                                                       |
      | kernel /platform/i86pc/multiboot -x                                  |
      | module /platform/i86pc/boot_archive                                  |
      +----------------------------------------------------------------------+
      Use the ^ and v keys to select which entry is highlighted.
      Press 'b' to boot, 'e' to edit the selected command in the
      boot sequence, 'c' for a command-line, 'o' to open a new line
      after ('O' for before) the selected line, 'd' to remove the
      selected line, or escape to go back to the main menu.-
    5. 键入 b 将节点引导至非群集模式。


      注 –

      对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请重新执行上述步骤,并将 -x 选项添加到内核引导参数命令中。



示例 3–14 SPARC: 在非群集模式下引导全局群集节点

以下示例显示了当节点 phys-schost-1 关闭并以非群集模式重新启动时的控制台输出。-g0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes,而 -i0 选项则表示调用运行级别 0 (零)。全局群集中其他节点的控制台上也显示此节点的关闭消息。


phys-schost# clnode evacuate phys-schost-1
phys-schost# cluster shutdown -g0 -y
Shutdown started.    Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 

WARNING: CMM monitoring disabled.
phys-schost-1# 
...
rg_name = schost-sa-1 ...
offline node = phys-schost-2 ...
num of node = 0 ...
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
Print services stopped.
syslogd: going down on signal 15
...
The system is down.
syncing file systems... done
WARNING: node phys-schost-1 is being shut down.
Program terminated

ok boot -x
...
Not booting as part of cluster
...
The system is ready.
phys-schost-1 console login:

修复已满的 /var 文件系统

Solaris 软件和 Sun Cluster 软件均会将错误消息写入 /var/adm/messages 文件,经过一段时间这些消息可能会将 /var 文件系统的空间占满。如果群集节点的 /var 文件系统已满,可能无法在该节点上重新启动 Sun Cluster。此外,您可能无法登录到此节点。

Procedure如何修复已满的 /var 文件系统

如果某个节点报告 /var 文件系统已满而且继续运行 Sun Cluster 服务,则请按以下过程来清理被占满的文件系统。有关信息,请参阅《系统管理指南:高级管理》中的“查看系统消息” in 《系统管理指南:高级管理》

  1. /var 文件系统已满的群集节点上成为超级用户。

  2. 清理被占满的文件系统。

    例如,删除该文件系统中包含的无关紧要的文件。