JavaScript is required to for searching.
跳过导航链接
退出打印视图
Oracle Solaris Cluster 系统管理指南     Oracle Solaris Cluster 4.0 (简体中文)
search filter icon
search icon

文档信息

前言

1.  Oracle Solaris Cluster 管理简介

2.  Oracle Solaris Cluster 和 RBAC

3.  关闭和引导群集

关闭和引导群集概述

如何关闭群集

如何引导群集

如何重新引导群集

关闭和引导群集中的单个节点

如何关闭节点

如何引导节点

如何重新引导节点

如何以非群集模式引导节点

修复已满的 /var 文件系统

如何修复已满的 /var 文件系统

4.  数据复制方法

5.  管理全局设备、磁盘路径监视和群集文件系统

6.  管理法定

7.  管理群集互连和公共网络

8.  添加和删除节点

9.  管理群集

10.  对 CPU 使用控制的配置

11.  更新您的软件

12.  备份和恢复群集

A.  示例

索引

关闭和引导群集概述

Oracle Solaris Cluster cluster shutdown 命令以有序方式停止全局群集服务并完全关闭整个全局群集。您可以在移动全局群集的位置时使用 cluster shutdown 命令,或者在应用程序错误导致数据损坏时关闭全局群集。clzonecluster halt 命令停止在特定节点上运行的区域群集或所有已配置节点上的整个区域群集。(还可以在区域群集内使用 cluster shutdown 命令。)有关更多信息,请参见 cluster(1CL) 手册页。

在本章的操作过程中,phys-schost# 表示全局群集提示符。clzonecluster 交互式 shell 提示符为 clzc:schost>


注 - 使用 cluster shutdown 命令可确保正确关闭整个全局群集。Oracle Solaris shutdown 命令与 clnode evacuate 命令一起使用可关闭单个节点。有关更多信息,请参见如何关闭群集关闭和引导群集中的单个节点clnode(1CL) 手册页。


cluster shutdownclzonecluster halt 命令可通过执行下列操作分别停止全局群集或区域群集中的所有节点:

  1. 使所有正在运行的资源组脱机。

  2. 卸载全局群集或区域群集的所有群集文件系统。

  3. cluster shutdown 命令用于关闭全局群集或区域群集上的活动设备服务。

  4. cluster shutdown 命令运行 init 0,并使群集上的所有节点均显示 OpenBoot PROM ok 提示符(在基于 SPARC 的系统上)或在 GRUB 菜单中显示消息 "Press any key to continue"(在基于 x86 的系统上)。有关更多信息,请参见《Booting and Shutting Down Oracle Solaris on x86 Platforms》中的"Booting an x86 Based System Interactively"clzonecluster halt 命令执行 zoneadm - z zoneclustername halt 命令来停止(但不是关闭)区域群集的区域。


注 - 根据需要,您可以在非群集模式下引导节点,这样,节点便不是群集成员。非群集模式在安装群集软件或执行某些管理过程时很有用。有关更多信息,请参见如何以非群集模式引导节点


表 3-1 任务列表:关闭和引导群集

任务
指导
停止群集。
通过引导所有节点来启动群集。节点必须具有到群集互连的有效连接才能获得群集成员的身份。
重新引导群集。

如何关闭群集

您可以关闭全局群集、一个区域群集或所有区域群集。


注意

注意 - 不要在群集控制台上使用 send brk 来关闭全局群集节点或区域群集节点。群集内部不支持该命令。


phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。

  1. 如果您的全局群集或区域群集正在运行 Oracle Real Application Clusters (RAC),请关闭您要关闭的群集中的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在群集中的任一节点上,成为超级用户或承担可提供 solaris.cluster.admin RBAC 授权的角色。

    从全局群集的节点执行此过程中的所有步骤。

  3. 关闭全局群集、一个区域群集或所有区域群集。
    • 关闭全局群集。此操作还会关闭所有区域群集。
      phys-schost# cluster shutdown -g0 -y
    • 关闭特定的区域群集。
      phys-schost# clzonecluster halt zoneclustername
    • 关闭所有区域群集。
      phys-schost# clzonecluster halt +

      还可以在区域群集内使用 cluster shutdown 命令来关闭所有区域群集。

  4. 确认全局群集或区域群集上的所有节点都显示 ok 提示符(在基于 SPARC 的系统上)或显示 GRUB 菜单(在基于 x86 的系统上)。

    除非所有节点均显示 ok 提示符(在基于 SPARC 的系统上)或均处于引导子系统中(在基于 x86 的系统上),否则请勿关闭任何节点的电源。

    • 确认全局群集节点显示 ok 提示符(在基于 SPARC 的系统上)或消息 "Press any key to continue"(在基于 GRUB 的 x86 系统上)。
      phys-schost# cluster status -t node
    • 使用 status 子命令检验该区域群集是否已关闭。
      phys-schost# clzonecluster status
  5. 如有必要,请关闭全局群集节点的电源。

示例 3-1 关闭区域群集

以下示例关闭了一个名为 sczone 的区域群集。

phys-schost# clzonecluster halt sczone
Waiting for zone halt commands to complete on all the nodes of the zone cluster "sczone"...
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 2 of cluster 'sczone' died.
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 4 of cluster 'sczone' died.
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sczone' died.
Sep  5 19:06:01 schost-4 cl_runtime: NOTICE: Membership : Node 1 of cluster 'sczone' died.
phys-schost# 

示例 3-2 SPARC: 关闭全局群集

以下示例显示了当系统停止正常的全局群集操作并关闭所有节点以显示 ok 提示符时控制台的输出。-g 0 选项表示将关闭宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也会显示关闭消息。

phys-schost# cluster shutdown -g0 -y
Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 
WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling clnode evacuate
The system is down.
syncing file systems... done
Program terminated
ok 

示例 3-3 x86: 关闭全局群集

以下示例显示了当系统停止正常的全局群集操作并关闭所有节点时控制台的输出。在该示例中,没有在所有节点上均显示 ok 提示符。-g 0 选项表示将关闭宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也会显示关闭消息。

phys-schost# cluster shutdown -g0 -y
May  2 10:32:57 phys-schost-1 cl_runtime: 
WARNING: CMM: Monitoring disabled.  
root@phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling clnode evacuate
failfasts already disabled on node 1
Print services already stopped.
May  2 10:33:13 phys-schost-1 syslogd: going down on signal 15
The system is down.
syncing file systems... done
Type any key to continue 

另请参见

要重新启动已经关闭的全局群集或区域群集,请参见如何引导群集

如何引导群集

该过程说明了如何启动节点已经关闭的全局群集或区域群集。对于全局群集节点,系统显示 ok 提示符(在 SPARC 系统上)或消息 “Press any key to continue”(在基于 GRUB 的 x86 系统上)。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。


注 - 要创建区域群集,请按照《Oracle Solaris Cluster 软件安装指南》中的"配置区域群集"中的说明操作。


  1. 将每个节点都引导到群集模式下。

    从全局群集的节点执行此过程中的所有步骤。

    • 在基于 SPARC 的系统上,运行以下命令。
      ok boot
    • 在基于 x86 的系统上,运行以下命令。

      显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。

      有关基于 GRUB 的引导的更多信息,请参见《Booting and Shutting Down Oracle Solaris on x86 Platforms》中的"Booting an x86 Based System Interactively"


      注 - 节点必须具有到群集互连的有效连接才能获得群集成员的身份。


    • 如果您具有一个区域群集,便可以引导整个区域群集。
      phys-schost# clzonecluster boot zoneclustername
    • 如果您具有多个区域群集,便可以引导所有区域群集。请使用 + 代替 zoneclustername
  2. 验证引导节点时未发生错误,而且节点现在处于联机状态。

    cluster status 命令报告全局群集节点的状态。

    phys-schost# cluster status -t node

    当您从全局群集节点运行 clzonecluster status 状态命令时,该命令将报告区域群集节点的状态。

    phys-schost# clzonecluster status

    注 - 如果节点的 /var 文件系统已满,可能无法在该节点上重新启动 Oracle Solaris Cluster。如果出现该问题,请参见如何修复已满的 /var 文件系统。有关更多信息,请参见 clzonecluster(1CL) 手册页。


示例 3-4 SPARC: 引导全局群集

以下示例显示了将节点 phys-schost-1 引导到全局群集后的控制台输出。全局群集中其他节点的控制台上会显示类似的消息。当某个区域群集的自动引导属性设置为 true 时,系统将在引导该计算机上的全局群集节点之后自动引导该区域群集节点。

当全局群集节点重新引导时,该计算机上的所有区域群集节点都将停止。在该全局群集节点重新启动之后,将引导同一计算机上自动引导属性设置为 true 的任何区域群集节点。

ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node phys-schost-1 with votecount = 1 added.
NOTICE: Node phys-schost-2 with votecount = 1 added.
NOTICE: Node phys-schost-3 with votecount = 1 added.
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-2 (incarnation # 937690106) has become reachable.
NOTICE: Node phys-schost-3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node phys-schost-1 is up; new incarnation number = 937846227.
NOTICE: node phys-schost-2 is up; new incarnation number = 937690106.
NOTICE: node phys-schost-3 is up; new incarnation number = 937690290.
NOTICE: Cluster members: phys-schost-1 phys-schost-2 phys-schost-3.
...

如何重新引导群集

要关闭全局群集,请运行 cluster shutdown 命令,然后在每个节点上使用 boot 命令引导全局群集。要关闭区域群集,请使用 clzonecluster halt 命令,然后使用 clzonecluster boot 命令引导该区域群集。您还可以使用 clzonecluster reboot 命令。有关更多信息,请参见 cluster(1CL)boot(1M)clzonecluster(1CL) 手册页。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。

  1. 如果您的群集正在运行 Oracle RAC,请关闭您要关闭的群集中的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在群集中的任一节点上,成为超级用户或承担可提供 solaris.cluster.admin RBAC 授权的角色。

    从全局群集的节点执行此过程中的所有步骤。

  3. 关闭群集。
    • 关闭全局群集。
      phys-schost# cluster shutdown -g0 -y 
    • 如果您具有区域群集,请从全局群集节点关闭该区域群集。
      phys-schost# clzonecluster halt zoneclustername

    将关闭所有节点。还可以在区域群集内使用 cluster shutdown 命令来关闭该区域群集。


    注 - 节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 引导每个节点。

    除非在两次关闭操作之间更改了配置,否则,节点的引导顺序无关紧要。如果在两次关闭操作之间进行了配置更改,则首先启动具有最新配置的节点。

    • 对于基于 SPARC 的系统上的全局群集节点,请运行以下命令。

      ok boot
    • 对于基于 x86 的系统上的全局群集节点,请运行以下命令。

      显示 GRUB 菜单后,选择相应的 Oracle Solaris OS 条目,然后按 Enter 键。


    注 - 节点必须具有到群集互连的有效连接才能获得群集成员的身份。


    有关基于 GRUB 的引导的更多信息,请参见《Booting and Shutting Down Oracle Solaris on x86 Platforms》中的"Booting an x86 Based System Interactively"

    • 对于区域群集,请在全局群集的单个节点上键入以下命令来引导该区域群集。

      phys-schost# clzonecluster boot zoneclustername

    当群集组件被激活时,所引导的节点的控制台上将显示消息。

  5. 验证引导节点时未发生错误,而且节点现在处于联机状态。
    • clnode status 命令报告全局群集中节点的状态。
      phys-schost# clnode status
    • 在全局群集节点上运行 clzonecluster status 命令将报告区域群集节点的状态。
      phys-schost# clzonecluster status

      还可以在区域群集内运行 cluster status 命令来查看节点的状态。


      注 - 如果节点的 /var 文件系统已满,可能无法在该节点上重新启动 Oracle Solaris Cluster。如果出现该问题,请参见如何修复已满的 /var 文件系统


示例 3-5 重新引导区域群集

以下示例显示了如何停止和引导一个名为 sparse-sczone 的区域群集。您还可以使用 clzonecluster reboot 命令。

phys-schost# clzonecluster halt sparse-sczone
Waiting for zone halt commands to complete on all the nodes of the zone cluster "sparse-sczone"...
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 4 of cluster 'sparse-sczone' died.
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 2 of cluster 'sparse-sczone' died.
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 1 of cluster 'sparse-sczone' died.
Sep  5 19:17:46 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' died.
phys-schost#
phys-schost# clzonecluster boot sparse-sczone
Waiting for zone boot commands to complete on all the nodes of the zone cluster "sparse-sczone"...
phys-schost# Sep  5 19:18:23 schost-4  cl_runtime: NOTICE: Membership : Node 1 of cluster
 'sparse-sczone' joined.
Sep  5 19:18:23 schost-4 cl_runtime: NOTICE: Membership : Node 2 of cluster 'sparse-sczone' joined.
Sep  5 19:18:23 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' joined.
Sep  5 19:18:23 schost-4 cl_runtime: NOTICE: Membership : Node 4 of cluster 'sparse-sczone' joined.

phys-schost#
phys-schost# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---

Name            Node Name   Zone HostName   Status   Zone Status
----            ---------   -------------   ------   -----------
sparse-sczone   schost-1    sczone-1        Online   Running
                schost-2    sczone-2        Online   Running
                schost-3    sczone-3        Online   Running
                schost-4    sczone-4        Online   Running
phys-schost# 

示例 3-6 SPARC: 重新引导全局群集

以下示例显示了当停止正常的全局群集操作、所有节点均关闭以显示 ok 提示符并且全局群集重新启动时的控制台输出。-g 0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也会显示关闭消息。

phys-schost# cluster shutdown -g0 -y
Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 
WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-2 (incarnation # 937690106) has become reachable.
NOTICE: Node phys-schost-3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members: phys-schost-1 phys-schost-2 phys-schost-3.
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: